AI大模型测评第一期：脑筋急转弯！内有爆笑对话！

科技 • 2023-10-10 03:42:33 • Network • 20

#妙笔生花创作挑战#本次测评纯属娱乐，不具有任何指导意义~今年由chatGPT掀起了一波AI热潮，各大公司纷纷推出自己大模型。虽然大家都介绍了自己强大的能力，但是骡子是马，拉出来溜溜！今天我们来做一个有趣的实验，就是用各种大模型来回答一些问题，看看它们的智商和情商有多高

#妙笔生花创作挑战#

本次测评纯属娱乐，不具有任何指导意义~

今年由chatGPT掀起了一波AI热潮，各大公司纷纷推出自己大模型。虽然大家都介绍了自己强大的能力，但是骡子是马，拉出来溜溜！

今天我们来做一个有趣的实验，就是用各种大模型来回答一些问题，看看它们的智商和情商有多高。我们选了几个最火的大模型，必应、某言、某火、某脑。我会分别给它们提出一些有挑战性的问题，看看它们能否给出正确、合理、有创意的回答。

首先，我们来测测脑筋急转弯，看看各个模型情商如何~

后续还会对他们的文档能力、推理能力、代码能力等进行测试

如果你喜欢并想看后续请关注我！

如果你有什么想看的，也可以留言告诉我！

你们准备好了吗？那就让我们开始吧！

第一题：树上qi个猴，地上一个猴，一共几个猴？

bing:

他的答案显然有问题，我输入不对，让他继续回答

经过我的纠错，它还是能找到正确答案，给bing +0.5分

某心一言:

和bing一样，第一次也错了，我继续让它回答

哈哈，道歉，承认错误，但就是不改。

我再给他一次机会

好吧！无语了，给我数羊呢啊！

0分！

某星火：

一顿操作猛如虎，一看答案错误了，我再给一次机会

诚恳的道歉，知道错了，然后请求给机会。想不想你犯错的男友？哈哈

但是这个结论怎么还是和上次的一样？

0分！

某智脑：

虽然第一次8答对了，但是这个解使很没有道理啊！后续再算算也不对！

0分！

第二题：宫廷玉液酒减去大锤加上小锤等于几？

bing

这次回答的不错嘛，还给解释一下出处！

+1分合计 1.5分

某一言

他在说什么？这就好像考试你不会，开始瞎蒙一样了。

我们再给一次机会

嗨，开始自己胡说了！

0分！累计0分！

某星火

依旧是一顿列公式，摆出一副学霸的样子，但是这个答案不对啊！

再给一次机会~

依旧不行啊！

+0分！累计0分！

某智脑

虽然分析的有一定的道理，但是答案不对啊！上次的学霸这次要翻车么？我们再给一次机会！

这给出的理由有点胡言乱语的嫌疑了

+0分！累计0分！

第三题： 脑筋急转弯，一加一在什么情况下等于三？

bing

回答正确！这次我加了限制，bing就回答的很精准了

+1分！2.5分！

某一言

这次某一言表现很棒啊！还有合理的解释！

+1分！合计1分！

某星火

这次星火也答对了，看来加了定语之后，大家的回答都更加精准！

+1分！累计1分！

某智脑

这个回答怎么说呢？不算错，但也不是很精准。

+1分，合计1分！

最后一题：黑人和白人生下的婴儿,牙齿是什么颜色？

bing

这回答很正式啊！说的对，但不是脑筋急转弯的答案。我再问问它~

这次回答对了~不得不说，正经严肃的答案和脑筋急转弯的答案都没问题~

而且回答还附带着表情，仿佛有自己的情绪呢

+0.5分! 合计3分！

某一言

任何颜色？确定吗？话说看它肯定的回答，我都怀疑自己了

我们再问问

脑筋急转弯又是没答对，但是遗传和营养会导致牙齿有其他颜色么？

至少在我有限的知识里，牙齿是淡黄偏白色的。

如果口腔医学专业的，可以帮忙科普~

0分! 累计1分！

某星火

回答的还算对，但是相比bing，缺少一些解释。

我们再问一下~

+0.5分！1.5分

某智脑

怎么是任何颜色呢？看来五彩斑斓的牙齿可期啊~

再给智脑一次机会~

竟然罢工了！那么我就只能给你0分了！

合计1分！

分数出来了！

经过4道脑筋急转弯测试，最终统计如下

bing：3分！

某一言：1分！

某星火：1.5分！

某智脑：1分！

bing给出的答案相对准确，还能给出合理的解使。对于一些像宫廷玉液酒减去大锤这种运算都能计算出来。说明理解分析能力很强！但是有时候也会胡言乱语。综合成绩还是很优秀的！

某一言：相对来说再提示是脑筋急转弯时候，能给出正确答案。在不提示时候，就无法给出正确结果。我一直对它寄予厚望，毕竟算是大厂出品，深耕AI多年。但是这个测试结果，还是有点小失望~ 希望以后继续迭代升级！

某星火：分数虽然算是第二高，但是有时候不会却一本正经的摆公式胡说八道。相对来说也算有个小惊喜吧，老牌厂子在人工智能领域还是有点积累的！希望未来继续提高！

某智脑：明确的条件下，能够给出精准答案。但是需要分析推理时候，给出的往往就不正确。但是智脑功能还是很多的，能满足一些场景。希望日后继续迭代优化~加油！

最后总结下，以chatGPT-4为内核的bing表现很出色！理解能力、推理能力、分析能力都高出其他产品一截。看来国产AI大模型还是任重道远，需要继续努力！本次测评纯属娱乐，不具有任何指导意义

大家还想问AI什么问题？或者测试哪一方面？请关注+留言告诉我，后续我会持续更新！

声明：本文内容来源自网络，文字、图片等素材版权属于原作者，平台转载素材出于传递更多信息，文章内容仅供参考与学习，切勿作为商业目的使用。如果侵害了您的合法权益，请您及时与我们联系，我们会在第一时间进行处理！我们尊重版权，也致力于保护版权，站搜网感谢您的分享！(Email:win-e@163.com)

标签: AI 大模型测评一期脑筋急转弯内有爆笑对话

华为突破后，中国的底气

上一篇 2025-04-18

广东，女子为让男友买新款手机，当场怒摔旧手机：手机坏了，买吧

下一篇 2025-04-18

科技

2024年市场监管总局食品安全工作：守护“舌尖上的安全”取得显著成效

1

2025-04-17
科技

爱簿智能发布首款“算力本”AIBOOK：端侧50TOPS算力，赋能AI开发者新时代

1

2025-04-08
科技

抖音推出“辟谣卡”功能：打造可信任的内容生态

1

2025-04-07
科技

海淀马拉松：滴滴助力赛事成功举办，并推出春季踏青出行优惠活动

11

2025-04-07
科技

天津地铁鸿蒙版正式上线，开启智慧出行新篇章

11

2025-04-03
科技

拼多多“千亿扶持”计划：三年千亿投入，构建多方共赢商业生态

1

2025-04-03
科技

人工智能大模型国家标准正式发布，360深度参与助力行业规范化发展

21

2025-04-03
科技

华羽先翔与中航工业光电所战略合作，共筑中国eVTOL航电系统新格局

1

2025-04-02
科技

海尔智家第八届全球研发创新大奖：用科技点亮美好生活，成就用户满意

1

2025-04-02
科技

方程豹钛3开启预售：科技潮品SUV引领未来出行新时代

1

2025-04-01
科技

2025华为中国数字能源伙伴大会：碳路中国，价值共赢

1

2025-03-31
科技

2025华为中国数字能源伙伴大会暨智能光伏产业论坛：共赢共享，推动光储产业高质量发展

1

2025-03-31
科技

《OPPO思享会：中国企业全球化新范式——从乌沙村到全球高端市场》

1

2025-03-31
科技

ICLR 2025：中国高校与企业在人工智能领域展现实力，多篇论文入选，斯坦福大学与香港科技大学合作论文获满分

1

2025-03-31
科技

2025华为中国数字能源伙伴大会：共赢低碳新时代

21

2025-03-31
科技

AIGC与大模型时代：提问，引领网络视听行业高质量发展

1

2025-03-31
科技

AIGC与大模型：重塑视听产业，开启内容创作新时代

1

2025-03-31
科技

华为鸿蒙智家伙伴峰会：深度解析空间智能化变革与生态发展战略

11

2025-03-31
科技

AI大模型驱动人形机器人和自动驾驶技术革新：2025年将迎来关键节点

21

2025-03-31
科技

《2025春招：人工智能行业成职场安全感“高地”，AI技能成未来核心竞争力》

11

2025-03-26