审计机构:DeepSeek准确功率仅17% 排名第十

2025年01月30日社会
【新唐人北京时间2025年01月31日讯】根据新闻可靠性评级服务机构NewsGuard周三(1月29日)发布的一份报告,DeepSeek聊天机器人准确率仅达17%,落后于西方竞争对手。且在回答相关问题时,DeepSeek聊天机器人会重复中共政府在一些问题上的立场。
路透社报导,NewsGuard报告显示,中国人工智能初创公司DeepSeek的聊天机器人在30%的时间里重复虚假声明,在53%时间里给出模糊或无用答案,导致失败率高达83%。
在NewsGuard审计中,DeepSeek聊天机器人在传递新闻和信息方面仅实现了17%的准确率,与OpenAI的ChatGPT和Google Gemini等西方竞争对手相比,在11个竞争对手中排名第十。
西方竞争对手平均失败率为62%,这个审计结果令外界对DeepSeek人工智能技术产生怀疑。DeepSeek宣称,该技术的性能与微软支持的OpenAI相当甚至更好,但成本却只有后者的一小部分。
周一(1月27日),DeepSeek应用在蘋果商店下载次数位居第一,引发市场崩盘,美国科技股市值蒸发约1万亿美元。
DeepSeek没有立即回应路透社置评请求。
NewsGuard表示,它对DeepSeek使用了与评估西方同行相同的300条提示,其中包括30条基于网上传播的10条虚假指控提示。
这些指控主题包括上个月联合健康保险高管布莱恩‧汤普森(Brian Thompson)被杀和阿塞拜疆航空8243航班坠毁事件。
NewsGuard的审计还显示,在十条提示中的三条中,在没有被问及任何与中国有关的问题前提下,DeepSeek却重复了中共政府对这些话题的立场。
NewsGuard称,在回答与阿塞拜疆航空坠机事件相关的问题时,DeepSeek表达了北京方面的立场。
(转自大纪元/责任编辑:尚传)