AI大模型测评第一期：脑筋急转弯！内有爆笑对话！

科技 • 2023-10-10 03:42:33 • Network •

#妙笔生花创作挑战#本次测评纯属娱乐，不具有任何指导意义~今年由chatGPT掀起了一波AI热潮，各大公司纷纷推出自己大模型。虽然大家都介绍了自己强大的能力，但是骡子是马，拉出来溜溜！今天我们来做一个有趣的实验，就是用各种大模型来回答一些问题，看看它们的智商和情商有多高

#妙笔生花创作挑战#

本次测评纯属娱乐，不具有任何指导意义~

今年由chatGPT掀起了一波AI热潮，各大公司纷纷推出自己大模型。虽然大家都介绍了自己强大的能力，但是骡子是马，拉出来溜溜！

今天我们来做一个有趣的实验，就是用各种大模型来回答一些问题，看看它们的智商和情商有多高。我们选了几个最火的大模型，必应、某言、某火、某脑。我会分别给它们提出一些有挑战性的问题，看看它们能否给出正确、合理、有创意的回答。

首先，我们来测测脑筋急转弯，看看各个模型情商如何~

后续还会对他们的文档能力、推理能力、代码能力等进行测试

如果你喜欢并想看后续请关注我！

如果你有什么想看的，也可以留言告诉我！

你们准备好了吗？那就让我们开始吧！

第一题：树上qi个猴，地上一个猴，一共几个猴？

bing:

他的答案显然有问题，我输入不对，让他继续回答

经过我的纠错，它还是能找到正确答案，给bing +0.5分

某心一言:

和bing一样，第一次也错了，我继续让它回答

哈哈，道歉，承认错误，但就是不改。

我再给他一次机会

好吧！无语了，给我数羊呢啊！

0分！

某星火：

一顿操作猛如虎，一看答案错误了，我再给一次机会

诚恳的道歉，知道错了，然后请求给机会。想不想你犯错的男友？哈哈

但是这个结论怎么还是和上次的一样？

0分！

某智脑：

虽然第一次8答对了，但是这个解使很没有道理啊！后续再算算也不对！

0分！

第二题：宫廷玉液酒减去大锤加上小锤等于几？

bing

这次回答的不错嘛，还给解释一下出处！

+1分合计 1.5分

某一言

他在说什么？这就好像考试你不会，开始瞎蒙一样了。

我们再给一次机会

嗨，开始自己胡说了！

0分！累计0分！

某星火

依旧是一顿列公式，摆出一副学霸的样子，但是这个答案不对啊！

再给一次机会~

依旧不行啊！

+0分！累计0分！

某智脑

虽然分析的有一定的道理，但是答案不对啊！上次的学霸这次要翻车么？我们再给一次机会！

这给出的理由有点胡言乱语的嫌疑了

+0分！累计0分！

第三题： 脑筋急转弯，一加一在什么情况下等于三？

bing

回答正确！这次我加了限制，bing就回答的很精准了

+1分！2.5分！

某一言

这次某一言表现很棒啊！还有合理的解释！

+1分！合计1分！

某星火

这次星火也答对了，看来加了定语之后，大家的回答都更加精准！

+1分！累计1分！

某智脑

这个回答怎么说呢？不算错，但也不是很精准。

+1分，合计1分！

最后一题：黑人和白人生下的婴儿,牙齿是什么颜色？

bing

这回答很正式啊！说的对，但不是脑筋急转弯的答案。我再问问它~

这次回答对了~不得不说，正经严肃的答案和脑筋急转弯的答案都没问题~

而且回答还附带着表情，仿佛有自己的情绪呢

+0.5分! 合计3分！

某一言

任何颜色？确定吗？话说看它肯定的回答，我都怀疑自己了

我们再问问

脑筋急转弯又是没答对，但是遗传和营养会导致牙齿有其他颜色么？

至少在我有限的知识里，牙齿是淡黄偏白色的。

如果口腔医学专业的，可以帮忙科普~

0分! 累计1分！

某星火

回答的还算对，但是相比bing，缺少一些解释。

我们再问一下~

+0.5分！1.5分

某智脑

怎么是任何颜色呢？看来五彩斑斓的牙齿可期啊~

再给智脑一次机会~

竟然罢工了！那么我就只能给你0分了！

合计1分！

分数出来了！

经过4道脑筋急转弯测试，最终统计如下

bing：3分！

某一言：1分！

某星火：1.5分！

某智脑：1分！

bing给出的答案相对准确，还能给出合理的解使。对于一些像宫廷玉液酒减去大锤这种运算都能计算出来。说明理解分析能力很强！但是有时候也会胡言乱语。综合成绩还是很优秀的！

某一言：相对来说再提示是脑筋急转弯时候，能给出正确答案。在不提示时候，就无法给出正确结果。我一直对它寄予厚望，毕竟算是大厂出品，深耕AI多年。但是这个测试结果，还是有点小失望~ 希望以后继续迭代升级！

某星火：分数虽然算是第二高，但是有时候不会却一本正经的摆公式胡说八道。相对来说也算有个小惊喜吧，老牌厂子在人工智能领域还是有点积累的！希望未来继续提高！

某智脑：明确的条件下，能够给出精准答案。但是需要分析推理时候，给出的往往就不正确。但是智脑功能还是很多的，能满足一些场景。希望日后继续迭代优化~加油！

最后总结下，以chatGPT-4为内核的bing表现很出色！理解能力、推理能力、分析能力都高出其他产品一截。看来国产AI大模型还是任重道远，需要继续努力！本次测评纯属娱乐，不具有任何指导意义

大家还想问AI什么问题？或者测试哪一方面？请关注+留言告诉我，后续我会持续更新！

声明：本文内容来源自网络，文字、图片等素材版权属于原作者，平台转载素材出于传递更多信息，文章内容仅供参考与学习，切勿作为商业目的使用。如果侵害了您的合法权益，请您及时与我们联系，我们会在第一时间进行处理！我们尊重版权，也致力于保护版权，站搜网感谢您的分享！(Email:[email protected])

标签: AI 大模型测评一期脑筋急转弯内有爆笑对话

华为突破后，中国的底气

上一篇 2024-12-22

广东，女子为让男友买新款手机，当场怒摔旧手机：手机坏了，买吧

下一篇 2024-12-22

科技

鸿海暂停收购日产：日产本田合并谈判成关键变数

1

2024-12-21
科技

《意大利数据保护局对OpenAI处以1500万欧元罚款，因ChatGPT违反数据保护法规》

1

2024-12-21
科技

OpenAI发布下一代推理模型系列o3：全功能版与精简版o3-mini即将推出

1

2024-12-21
科技

英特尔高管被控管理不善，股东LRTrust索赔巨额损失

1

2024-12-21
科技

辽宁省与百度签署战略合作框架协议，携手推动人工智能产业发展

1

2024-12-20
科技

万勋科技：近2亿元融资助力软体机器人技术全球领先，CES 2025展会带来技术突破

1

2024-12-20
科技

智源研究院发布100余款大模型评测结果：多模态模型崛起，应用落地成关键

1

2024-12-20
科技

货拉拉2025新春拉货节：助力春运，为用户和司机送上新年福利

1

2024-12-20
科技

周鸿祎香港大学讲座：大模型时代，年轻人该如何抓住机遇？

1

2024-12-20
科技

2025年：科学与科技的重大事件及全球性挑战

1

2024-12-20
科技

问界崛起：赛力斯与华为携手打造中国豪华智能汽车新标杆

1

2024-12-19
科技

《解限机》：中国首款机甲风电竞游戏，在TGA 2024惊艳亮相，备受全球瞩目

1

2024-12-19
科技

爱玛A7 Plus：年轻一代的“两轮豪华轿跑”正式发布

1

2024-12-19
科技

国际新能源解决方案平台（INES）第三届第三次理事会：共绘“双碳”未来蓝图

1

2024-12-19
科技

苹果洽谈与腾讯AI大模型合作，整合至中国iPhone？腾讯暂不回应

1

2024-12-19
科技

蚂蚁集团否认借壳上市传闻，CEO将由韩歆毅接任

1

2024-12-19
科技

深度睡眠中的慢波：记忆巩固的幕后推手

1

2024-12-19
科技

微信公众号上线“作者朗读音色”功能，让文章朗读更具个性化

1

2024-12-18
科技

“孙武故里·现代之城·幸福广饶”第十二届中国大学生高分子材料创新创业大赛决赛盛大开幕

1

2024-12-18
科技

《HarmonyOS NEXT赋能：华为信息流生态的突破与未来展望》

1

2024-12-18