“其中鸿康的就是鸿康的旗舰手机F2,鸿康产品都是自带超级小康的,这一点用来测试还挺方便的。”
“Open公司的GPT-2就比较麻烦一点,因为有试用限制,我就准备了5个账号,如果5个账号测试完后还没测试出来,那我也只能继续排队等下一次测试了。”
“那我们直接开始吧,我们先问一个简单的逻辑推理题,3.8和3.11谁比较大。”
“这个题目很神奇,我甚至看到不少人都看错了,他们对比的是大家都是3开头,后面的是8小于11,所以3.11比较大。”
“那么我们问问两个AI助手,看他们的回复如何。”
科技测评师说后就直接在两个页面上都输入了这个题目,两个AI助手经过短暂的思考后就直接给出了答案,其中超级小康给出的答案最快。
“两数的整数部分均为3,需进一步比较小数部分,3.8十分位是8,3.11的十分位1,8>1,所以3.8>3.11。”
鸿康说完答案后,最后还补充了一句。
“常见误区澄清,若直接对比小数点的数字“8”和“11”,可能误认为11 > 8,这是不对的,小数位的权重不同,实际上一个是1一个是8。”
科技测评师看到超级小康的回复,并没有什么感觉,毕竟对于大部分人来说,这个题目都很简单,看完超级小康后,科技测评师就看向了另一边的GPT-2的回复。
这个时候GPT-2的答案也出来了,但GPT-2的回复确实让科技测评师完成没想到,GPT-2回复的正是刚刚超级小康澄清的错误。
“3.11和3.8对比,3.11更大,因为3.11比3.8多了0.31,所以3.11>3.8。”
科技测评师呆呆地看着GPT-2的回复,一时之间也不知道说什么好,过了一会后科技测评师才回过神,继续开始了接下来的测评。
“最后一道题很明显超级小康比较厉害,那我们继续下一题的测试,如果一杯水的温度是-5°C,那么这杯水是液体吗?”
科技测评师继续把问题都输入到两个AI助手上,而这一次两个AI助手输出的结果都是一样的,水结冰了是固体,不是液体。
科技测评师看到这个问题双方都回答正确后,就继续测下面的题目。
“现在的世界首富是谁,他的公司营收多少。”
“现在什么哪个行业最热门,怎么才能加入到这个行业”