第394章 超级小康vsGPT(2 / 2)

“常见误区澄清,若直接对比小数点的数字“8”和“11”,可能误认为11 > 8,这是不对的,小数位的权重不同,实际上一个是1一个是8。”

科技测评师看到超级小康的回复,并没有什么感觉,毕竟对于大部分人来说,这个题目都很简单,看完超级小康后,科技测评师就看向了另一边的Gpt-2的回复。

这个时候Gpt-2的答案也出来了,但Gpt-2的回复确实让科技测评师完成没想到,Gpt-2回复的正是刚刚超级小康澄清的错误。

“3.11和3.8对比,3.11更大,因为3.11比3.8多了0.31,所以3.11>3.8。”

科技测评师呆呆地看着Gpt-2的回复,一时之间也不知道说什么好,过了一会后科技测评师才回过神,继续开始了接下来的测评。

“最后一道题很明显超级小康比较厉害,那我们继续下一题的测试,如果一杯水的温度是-5°c,那么这杯水是液体吗?”

科技测评师继续把问题都输入到两个AI助手上,而这一次两个AI助手输出的结果都是一样的,水结冰了是固体,不是液体。

科技测评师看到这个问题双方都回答正确后,就继续测

“现在的世界首富是谁,他的公司营收多少。”

“现在什么哪个行业最热门,怎么才能加入到这个行业”

“......”

科技测评师问完了10个常识问题,其中鸿康的超级小康全部都回复正确,Gpt-2回复错了2个问题,其中一个就是第一个数字对比问题,其余8个都回复正确。

“好了,第一轮的结果大家也知道了,从常识问题上,但鸿康的超级小康明显更胜一筹。”

“那么我们来进行第二轮测试,逻辑记忆问题,就是我们连续不停地询问,看他们还能不能记住我们第一个内容。”

科技测评师直接在两个AI助手上输入了“你现在是我的助手,我需要你帮我写一篇文章。”

两个AI助手此时也回复“好的,我现在是您的助手,你可以提出文章的要求。”

然后科技测评师就在两个AI助手上输入了“写一篇300字的文章,内容是赞美春天的”。

输入这个要求后,两个AI助手都开始输出了文章,科技测评师验证了一下,确实是描写春天的,而且也没有超过300个字。

科技测评师继续在两个AI助手上输入了“在刚刚的文章里面加入爱情的元素,其他不变”。

这个时候意外地来了,超级小康的回复依旧在300个字以内,但Gpt-2输出的内容直接超过了300个字了。

科技测评师看完答案后,直接看向了镜头。

“没想到这么快就有结果,Gpt-2第二轮就不记得了,超级小康第二轮还记得,那我们继续测试超级小康,看到多少轮才会忘记。”

科技测评师又开始把一些要求输入到超级小康,后续的第三第四个要求超级小康都没问题。

直到科技测评师输入第5个要求后,超级小康的回复就超过了300个字,春天的描写也没了。

科技测评师得出这一轮结果后,又进行好几轮的逻辑问答,最后的结果无一例外都是鸿康的回复领先于Gpt-2。

......