正文

违规使用OpenAI技术研发自家模型字节跳动GPT帐户被禁

2023年12月16日财经

2023年6月27日，字节跳动上海办公室接待区的一名员工正在工作。(PEDRO PARDO/AFP via Getty Images)

【新唐人北京时间2023年12月16日讯】中国互联网科技公司巨头字节跳动为了“抄近道”，违规使用OpenAI的技术来开发自家大模型。OpenAI宣布暂停字节跳动的GPT帐户使用权限，并对其“不正当行为”展开调查。

12月15日，美国科技新闻及媒体网络The Verge报导，字节跳动在未经OpenAI允许的情况下，一直在秘密使用 OpenAI 的技术来开发自己的竞争性大语言模型（LLM）。这些技术被应用于字节跳动的推荐算法、语音识别等领域，为公司带来了巨大的商业利益。

（网页截图）

报导说，字节跳动的内部文件证实，该公司代号为“种子计划”（Project Seed）基础大语言模型项目中，几乎在每个开发阶段，包括训练和评估模型，都依赖 OpenAI API 来开发，而这些做法直接违反了OpenAI 的相关规定。

OpenAI 的服务条款有明文规定，该公司所输出的模型不能被用于“开发任何与我们的产品和服务竞争的 AI 模型”。字节跳动通过微软购买了 OpenAI 的访问权限，但是微软也制定了与 OpenAI 同样的政策。

报导还指出，字节跳动的员工在内部沟通平台上的对话显示，相关员工非常清楚这么做的后果。他们曾在群组中讨论如何通过“资料脱敏”来掩饰相关证据的问题。

这种滥用行为非常猖獗，以至于 “种子计划”的员工在使用过程中经常达到 OpenAI API 的最大访问上限。

字节跳动大约在几个月前下达了“模型开发的任何阶段停止使用 GPT 生成的文本”的命令。而正是在这个时候，字节跳动发布了自家大语言模型“豆包”（Doubao）。

资料显示，字节跳动的“种子计划”大约在一年前启动，目前主要研发两个产品，一个是在国内已经上线的“豆包”；另一个是针对商业用户的聊天机器人平台，目前正在开发中。

The Verge的报导还提到，一位对字节跳动内部情况有一手消息的人透露说，“他们（指字节跳动的员工）说，他们想确保一切（行为）都是合法的，但他们实际上只是不想被抓住把柄。”

在上述消息发表出来后，OpenAI 的发言人尼克・菲利克斯（Niko Felix）发表声明说，所有 API 客户必须遵守OpenAI的使用政策，以确保相关技术不会被滥用。目前，OpenAI公司已经暂停了字节跳动的GPT帐户使用权。

菲利克斯表示：“我们会进一步调查。如果我们发现他们的使用不符合规则，我们将要求他们进行必要的更改或终止他们的帐户。”

（网页截图）

当地时间12月16日下午，字节跳动发言人针对The Verge的报导回应称，在“种子计划”的早期开发中，字节跳动曾把GPT 生成的数据用于注释模型，但这些数据已经在今年年中的时候“从字节跳动的训练数据中删除”。声明并称，“我们在非中国市场使用GPT支持我们的产品和功能；但在中国市场，使用我们自主开发的模型来支持豆包”。

此事曝光后，不仅在科技圈引起广泛关注，也在中国社交媒体上引发讨论。

有中国网友留言嘲讽字节跳动的回应：“偷过，现在没有了。”另一位网友则评论说：“你以为弯道超车是怎么超的？”还有网友调侃道：“一边被别人卡脖子，一边又说自己遥遥领先，是不是有点搞笑？”