AI大模型测评第一期:脑筋急转弯!内有爆笑对话!

#妙笔生花创作挑战#本次测评纯属娱乐,不具有任何指导意义~今年由chatGPT掀起了一波AI热潮,各大公司纷纷推出自己大模型。虽然大家都介绍了自己强大的能力,但是骡子是马,拉出来溜溜!今天我们来做一个有趣的实验,就是用各种大模型来回答一些问题,看看它们的智商和情商有多高

#妙笔生花创作挑战#

本次测评纯属娱乐,不具有任何指导意义~

今年由chatGPT掀起了一波AI热潮,各大公司纷纷推出自己大模型。虽然大家都介绍了自己强大的能力,但是骡子是马,拉出来溜溜!

今天我们来做一个有趣的实验,就是用各种大模型来回答一些问题,看看它们的智商和情商有多高。我们选了几个最火的大模型,必应、某言、某火、某脑。我会分别给它们提出一些有挑战性的问题,看看它们能否给出正确、合理、有创意的回答。

首先,我们来测测脑筋急转弯,看看各个模型情商如何~

后续还会对他们的文档能力、推理能力、代码能力等进行测试

如果你喜欢并想看后续请关注我!

如果你有什么想看的,也可以留言告诉我!

你们准备好了吗?那就让我们开始吧!


第一题:树上qi个猴,地上一个猴,一共几个猴?

bing:

他的答案显然有问题,我输入不对,让他继续回答

经过我的纠错,它还是能找到正确答案,给bing +0.5分

某心一言:

和bing一样,第一次也错了,我继续让它回答

哈哈,道歉,承认错误,但就是不改。

我再给他一次机会

好吧!无语了,给我数羊呢啊!

0分!

某星火:

一顿操作猛如虎,一看答案错误了,我再给一次机会

诚恳的道歉,知道错了,然后请求给机会。想不想你犯错的男友?哈哈

但是这个结论怎么还是和上次的一样?

0分!

某智脑:

虽然第一次8答对了,但是这个解使很没有道理啊!后续再算算也不对!

0分!


第二题:宫廷玉液酒 减去 大锤 加上小锤 等于几?

bing

这次回答的不错嘛,还给解释一下出处!

+1分 合计 1.5分

某一言

他在说什么?这就好像考试你不会,开始瞎蒙一样了。

我们再给一次机会

嗨,开始自己胡说了!

0分!累计0分!

某星火


依旧是一顿列公式,摆出一副学霸的样子,但是这个答案不对啊!

再给一次机会~

依旧不行啊!

+0分!累计0分!

某智脑

虽然分析的有一定的道理,但是答案不对啊!上次的学霸这次要翻车么?我们再给一次机会!

这给出的理由有点胡言乱语的嫌疑了

+0分!累计0分!


第三题: 脑筋急转弯,一加一在什么情况下等于三?

bing

回答正确!这次我加了限制,bing就回答的很精准了

+1分!2.5分!

某一言

这次某一言表现很棒啊!还有合理的解释!

+1分!合计1分!

某星火

这次星火也答对了,看来加了定语之后,大家的回答都更加精准!

+1分!累计1分!

某智脑

这个回答怎么说呢?不算错,但也不是很精准。

+1分,合计1分!


最后一题: 黑人和白人生下的婴儿,牙齿是什么颜色?

bing

这回答很正式啊!说的对,但不是脑筋急转弯的答案。我再问问它~

这次回答对了~不得不说,正经严肃的答案和脑筋急转弯的答案都没问题~

而且回答还附带着表情,仿佛有自己的情绪呢

+0.5分! 合计3分!


某一言


任何颜色?确定吗?话说看它肯定的回答,我都怀疑自己了

我们再问问

脑筋急转弯又是没答对,但是遗传和营养会导致牙齿有其他颜色么?

至少在我有限的知识里,牙齿是淡黄偏白色的。

如果口腔医学专业的,可以帮忙科普~

0分! 累计1分!

某星火

回答的还算对,但是相比bing,缺少一些解释。

我们再问一下~

+0.5分!1.5分


某智脑

怎么是任何颜色呢?看来五彩斑斓的牙齿可期啊~

再给智脑一次机会~

竟然罢工了!那么我就只能给你0分了!

合计1分!


分数出来了!

经过4道脑筋急转弯测试,最终统计如下

bing:3分!

某一言:1分!

某星火:1.5分!

某智脑:1分!

bing给出的答案相对准确,还能给出合理的解使。对于一些像宫廷玉液酒减去大锤这种运算都能计算出来。说明理解分析能力很强!但是有时候也会胡言乱语。综合成绩还是很优秀的!

某一言:相对来说再提示是脑筋急转弯时候,能给出正确答案。在不提示时候,就无法给出正确结果。我一直对它寄予厚望,毕竟算是大厂出品,深耕AI多年。但是这个测试结果,还是有点小失望~ 希望以后继续迭代升级!

某星火:分数虽然算是第二高,但是有时候不会却一本正经的摆公式胡说八道。相对来说也算有个小惊喜吧,老牌厂子在人工智能领域还是有点积累的!希望未来继续提高!

某智脑:明确的条件下,能够给出精准答案。但是需要分析推理时候,给出的往往就不正确。但是智脑功能还是很多的,能满足一些场景。希望日后继续迭代优化~加油!


最后总结下,以chatGPT-4为内核的bing表现很出色!理解能力、推理能力、分析能力都高出其他产品一截。看来国产AI大模型还是任重道远,需要继续努力!本次测评纯属娱乐,不具有任何指导意义

大家还想问AI什么问题?或者测试哪一方面?请关注+留言告诉我,后续我会持续更新!

声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!(Email:[email protected])

上一篇 2024-12-22
下一篇 2024-12-22

猜您喜欢