订阅电子报

正文

审计机构：DeepSeek准确功率仅17% 排名第十

2025年01月30日社会

资料图。手机上显示的DeepSeek徽标。(NICOLAS TUCAT/AFP via Getty Images)

资料图。手机上显示的DeepSeek徽标。(NICOLAS TUCAT/AFP via Getty Images)

【新唐人北京时间2025年01月31日讯】根据新闻可靠性评级服务机构NewsGuard周三（1月29日）发布的一份报告，DeepSeek聊天机器人准确率仅达17%，落后于西方竞争对手。且在回答相关问题时，DeepSeek聊天机器人会重复中共政府在一些问题上的立场。

路透社报导，NewsGuard报告显示，中国人工智能初创公司DeepSeek的聊天机器人在30%的时间里重复虚假声明，在53%时间里给出模糊或无用答案，导致失败率高达83%。

在NewsGuard审计中，DeepSeek聊天机器人在传递新闻和信息方面仅实现了17%的准确率，与OpenAI的ChatGPT和Google Gemini等西方竞争对手相比，在11个竞争对手中排名第十。

西方竞争对手平均失败率为62%，这个审计结果令外界对DeepSeek人工智能技术产生怀疑。DeepSeek宣称，该技术的性能与微软支持的OpenAI相当甚至更好，但成本却只有后者的一小部分。

周一（1月27日），DeepSeek应用在蘋果商店下载次数位居第一，引发市场崩盘，美国科技股市值蒸发约1万亿美元。

DeepSeek没有立即回应路透社置评请求。

NewsGuard表示，它对DeepSeek使用了与评估西方同行相同的300条提示，其中包括30条基于网上传播的10条虚假指控提示。

这些指控主题包括上个月联合健康保险高管布莱恩‧汤普森（Brian Thompson）被杀和阿塞拜疆航空8243航班坠毁事件。

NewsGuard的审计还显示，在十条提示中的三条中，在没有被问及任何与中国有关的问题前提下，DeepSeek却重复了中共政府对这些话题的立场。

NewsGuard称，在回答与阿塞拜疆航空坠机事件相关的问题时，DeepSeek表达了北京方面的立场。

（转自大纪元/责任编辑：尚传）

相关话题

准确率

DeepSeek

NewsGuard

相关文章

你是哪个OpenAI型号？ DeepSeek回答露馅

你是哪个OpenAI型号？ DeepSeek回答露馅

2025年01月30日

南苏丹中资小飞机坠毁酿20死含2中国人

南苏丹中资小飞机坠毁酿20死含2中国人

2025年01月30日

釜山航空机尾失火乘客：听到“啪啪”声从置物柜传出

釜山航空机尾失火乘客：听到“啪啪”声从置物柜传出

2025年01月30日

法国卢浮宫大规模改造兴建第二个入口

法国卢浮宫大规模改造兴建第二个入口

2025年01月30日

两孩子读飞天12年成音乐专才母亲充满感激

两孩子读飞天12年成音乐专才母亲充满感激

2025年01月29日

担忧民众隐私受到侵犯意大利要App下架DeepSeek

担忧民众隐私受到侵犯意大利要App下架DeepSeek

2025年01月29日

印度大壶节发生踩踏事件已致39人遇难

印度大壶节发生踩踏事件已致39人遇难

2025年01月29日

中国传统年俗初一放鞭炮祈求平安吉祥

中国传统年俗初一放鞭炮祈求平安吉祥

2025年01月29日