订阅电子报

正文

ChatGPT和文心一言看图说话实测：智商对智障

2023年11月16日生活

2023年10月19日，在法国东部米卢斯，ChatGPT徽标旁边的小雕像。（SEBASTIEN BOZON/AFP via Getty Images）

2023年10月19日，在法国东部米卢斯，ChatGPT徽标旁边的小雕像。（SEBASTIEN BOZON/AFP via Getty Images）

【新唐人北京时间2023年11月17日讯】近日，网友实测了ChatGPT、文心一言看图说话的能力，结论是：一个可以称智商，一个是智障。

11月15日，微信公众号“Howie和小能熊”发文说，受网友启发，决定让ChatGPT和各个大模型一起来看图说话，横向对比下大模型的能力。

文章说，选取的图片不是随手拍照，而是漫画。漫画类图片是人类艺术家的创造性表达，经常有一些幽默、讽刺等微妙之意蕴含其中，需要一些理解能力才能解读。所以，测试的不只是“视力”，更是“智力”。

他用几幅图片，实测了美国ChatGPT和中国大陆百度开发的“文心一言”的看图说话能力。结果如下:

第一张图是《New Yorker》杂志最新一期封面:

ChatGPT和文心一言看图说话实测：智商对智障

（网络截图）

作者说，ChatGPT的回答“内容描述准确无错误，理解到位且无错误”。

ChatGPT和文心一言看图说话实测：智商对智障

（网络截图）

而文心一言的回答“充满了错误和幻觉，胡说八道的实例。你家小孩写看图作文写成这样，也就是0分了”。

ChatGPT和文心一言看图说话实测：智商对智障

（网路截图）

第二幅图，名为“人类沉迷，机器学习”（Humans are hooked, machines are learning）。

ChatGPT和文心一言看图说话实测：智商对智障

（网路截图）

作者评价，ChatGPT的答案“描述上有错，把长椅说成了课桌，理解上，GPT强调沉迷手机的人类忽视了外部环境和培养成长和创造力的活动，沉浸于数字世界。很棒！”

ChatGPT和文心一言看图说话实测：智商对智障

（网络截图）

而文心一言的回答“描述上胡言乱语，理解上乱七八糟。横批：什么玩意”。

ChatGPT和文心一言看图说话实测：智商对智障

（网路截图）

第三张图片，是Peanuts漫画“Born to Sleep”（天生喜欢睡觉）。

ChatGPT和文心一言看图说话实测：智商对智障

（网络截图）

作者评价说，ChatGPT“描述ok，还提供了人物的作者信息，可见世界知识很全。理解上，还脑补了snoopy的内心活动，不错！”

ChatGPT和文心一言看图说话实测：智商对智障

（网络截图）

而文心一言“描述上大量错误，胡说八道。理解肤浅”。

ChatGPT和文心一言看图说话实测：智商对智障

（网路截图）

作者还测试了其它实例，最后表示，自己之前认为两者存在几倍差距（1倍以上、10倍以下），但是现在发现，用数量差距、百分比、倍数来评价这些结果差异是不合适的。因为本质上不是数量差距，而是性质差距。无论是差2倍还是5倍，实际上都是不及格，都是不能用，对真实用户的真实使用场景没区别，都没意义。

所以，更准确的说法：这是 “能用”和“不能用”的差距。所谓“能用”，就是能用来取代你的部分任务，可以整合到你的工作流；而不能用，就是不能啊。

作者说，一个“不能用”的AI，看起来一本正经，甚至“不明觉厉”，但是，与真正的智能，还是有一字之别。

（责任编辑：李郦）

相关话题

智商

ChatGPT

文心一言

相关文章

加拿大最长寿老人将迎113岁生日分享人生智慧

加拿大最长寿老人将迎113岁生日分享人生智慧

2025年02月22日

【生活智慧】这样喝咖啡更好口感健康两不误

【生活智慧】这样喝咖啡更好口感健康两不误

2025年02月21日

如何让白床单更亮白柔软这个方法超简单

如何让白床单更亮白柔软这个方法超简单

2025年02月21日

一食材让脏袜子变白比白醋小苏打更省时间

一食材让脏袜子变白比白醋小苏打更省时间

2025年02月20日

微波炉的6个厨房小妙招你知道吗？

微波炉的6个厨房小妙招你知道吗？

2025年02月19日

喝什么样的咖啡更健康为什么？营养师做比对

喝什么样的咖啡更健康为什么？营养师做比对

2025年02月18日

这4个“毁眼”行为不要做 6招护眼恢复视力

这4个“毁眼”行为不要做 6招护眼恢复视力

2025年02月18日

【生活智慧】巧克力种类万万千包装上的“％数”代表什么？

【生活智慧】巧克力种类万万千包装上的“％数”代表什么？

2025年02月17日