#妙笔生花创作挑战#本次测评纯属娱乐,不具有任何指导意义~今年由chatGPT掀起了一波AI热潮,各大公司纷纷推出自己大模型。虽然大家都介绍了自己强大的能力,但是骡子是马,拉出来溜溜!今天我们来做一个有趣的实验,就是用各种大模型来回答一些问题,看看它们的智商和情商有多高
#妙笔生花创作挑战#
本次测评纯属娱乐,不具有任何指导意义~
今年由chatGPT掀起了一波AI热潮,各大公司纷纷推出自己大模型。虽然大家都介绍了自己强大的能力,但是骡子是马,拉出来溜溜!
今天我们来做一个有趣的实验,就是用各种大模型来回答一些问题,看看它们的智商和情商有多高。我们选了几个最火的大模型,必应、某言、某火、某脑。我会分别给它们提出一些有挑战性的问题,看看它们能否给出正确、合理、有创意的回答。
后续还会对他们的文档能力、推理能力、代码能力等进行测试
如果你喜欢并想看后续请关注我!
如果你有什么想看的,也可以留言告诉我!
你们准备好了吗?那就让我们开始吧!
第一题:树上qi个猴,地上一个猴,一共几个猴?
bing:

他的答案显然有问题,我输入不对,让他继续回答

经过我的纠错,它还是能找到正确答案,给bing +0.5分
某心一言:

和bing一样,第一次也错了,我继续让它回答

哈哈,道歉,承认错误,但就是不改。
我再给他一次机会

好吧!无语了,给我数羊呢啊!
0分!
某星火:

一顿操作猛如虎,一看答案错误了,我再给一次机会

诚恳的道歉,知道错了,然后请求给机会。想不想你犯错的男友?哈哈
但是这个结论怎么还是和上次的一样?
0分!
某智脑:

虽然第一次8答对了,但是这个解使很没有道理啊!后续再算算也不对!
0分!
第二题:宫廷玉液酒 减去 大锤 加上小锤 等于几?
bing

这次回答的不错嘛,还给解释一下出处!
+1分 合计 1.5分
某一言

他在说什么?这就好像考试你不会,开始瞎蒙一样了。
我们再给一次机会

嗨,开始自己胡说了!
0分!累计0分!
某星火

依旧是一顿列公式,摆出一副学霸的样子,但是这个答案不对啊!
再给一次机会~

依旧不行啊!
+0分!累计0分!
某智脑

虽然分析的有一定的道理,但是答案不对啊!上次的学霸这次要翻车么?我们再给一次机会!

这给出的理由有点胡言乱语的嫌疑了
+0分!累计0分!
第三题: 脑筋急转弯,一加一在什么情况下等于三?
bing

回答正确!这次我加了限制,bing就回答的很精准了
+1分!2.5分!
某一言

这次某一言表现很棒啊!还有合理的解释!
+1分!合计1分!
某星火

这次星火也答对了,看来加了定语之后,大家的回答都更加精准!
+1分!累计1分!
某智脑

这个回答怎么说呢?不算错,但也不是很精准。
+1分,合计1分!
最后一题: 黑人和白人生下的婴儿,牙齿是什么颜色?
bing

这回答很正式啊!说的对,但不是脑筋急转弯的答案。我再问问它~

这次回答对了~不得不说,正经严肃的答案和脑筋急转弯的答案都没问题~
而且回答还附带着表情,仿佛有自己的情绪呢
+0.5分! 合计3分!
某一言

任何颜色?确定吗?话说看它肯定的回答,我都怀疑自己了
我们再问问

脑筋急转弯又是没答对,但是遗传和营养会导致牙齿有其他颜色么?
至少在我有限的知识里,牙齿是淡黄偏白色的。
如果口腔医学专业的,可以帮忙科普~
0分! 累计1分!
某星火

回答的还算对,但是相比bing,缺少一些解释。
我们再问一下~
+0.5分!1.5分
某智脑

怎么是任何颜色呢?看来五彩斑斓的牙齿可期啊~
再给智脑一次机会~

竟然罢工了!那么我就只能给你0分了!
合计1分!
分数出来了!
经过4道脑筋急转弯测试,最终统计如下
bing:3分!
某一言:1分!
某星火:1.5分!
某智脑:1分!
bing给出的答案相对准确,还能给出合理的解使。对于一些像宫廷玉液酒减去大锤这种运算都能计算出来。说明理解分析能力很强!但是有时候也会胡言乱语。综合成绩还是很优秀的!
某一言:相对来说再提示是脑筋急转弯时候,能给出正确答案。在不提示时候,就无法给出正确结果。我一直对它寄予厚望,毕竟算是大厂出品,深耕AI多年。但是这个测试结果,还是有点小失望~ 希望以后继续迭代升级!
某星火:分数虽然算是第二高,但是有时候不会却一本正经的摆公式胡说八道。相对来说也算有个小惊喜吧,老牌厂子在人工智能领域还是有点积累的!希望未来继续提高!
某智脑:明确的条件下,能够给出精准答案。但是需要分析推理时候,给出的往往就不正确。但是智脑功能还是很多的,能满足一些场景。希望日后继续迭代优化~加油!
最后总结下,以chatGPT-4为内核的bing表现很出色!理解能力、推理能力、分析能力都高出其他产品一截。看来国产AI大模型还是任重道远,需要继续努力!本次测评纯属娱乐,不具有任何指导意义
大家还想问AI什么问题?或者测试哪一方面?请关注+留言告诉我,后续我会持续更新!
声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!(Email:[email protected])