厦门企业网站制作,网络销售怎么才能找到客户,做网站应该学什么,建网站要多少钱一台都说大模型要超越人类了#xff0c;今天就试试让kimi和通义千问做公务员考试题目#xff0c;谁能考高分#xff1f; 测评结果再次让人震惊#xff01; 问题提干#xff1a;大小两种规格的盒装鸡蛋#xff0c;大盒装23个#xff0c;小盒装16个#xff0c;采购员小王买了… 都说大模型要超越人类了今天就试试让kimi和通义千问做公务员考试题目谁能考高分 测评结果再次让人震惊 问题提干大小两种规格的盒装鸡蛋大盒装23个小盒装16个采购员小王买了500个鸡蛋大盒装一共比小盒装()请问括号中填多少
备注 这里稍微改写了下原题描述避免大模型搜索网上的答案。
Kimi考公 kimi上面的数学计算出现了错误。这是最简单的加减法错误。我告诉他错了。 通过上面的对话可以看出kimi开始给的方程式 23x 16y500对的但是自己无法计算出结果。
后面经过几轮对话我失去了耐心。。。。
放弃吧~
结论kimi考公失败
通义千问考公 通义千问开始方程式和kimi一样23x 16y500但是他一开始认为无解经过我二次提示他给出了答案x16, y7且洋洋得意地计算464112500这也是一个加法错误。
我尝试告诉他有其他答案这个答案不对。
但是他却倔强地说这是唯一解。
算了算了。
你是唯一解你没通过考验
结论通义千问考公失败
总结
通过上述对话可以看出kimi和通义千问都不具备根据逻辑题目分析和解析方程的能力。
即使使用最笨的方法从x1~x21遍历也能得到答案。
kimi有尝试使用遍历方法但是不知道为啥直接从x1跳到了x14就跳过了x12, y14的题目答案与答案失之交臂。
通义千问给出了错误答案坚持到底。
如果您对测评结果有疑问欢迎交流更多大模型案例在公众号首发。
#AIGC #kimi #通义千问 #大模型