违规使用OpenAI技术研发自家模型 字节跳动GPT帐户被禁

2023年12月16日财经
【新唐人北京时间2023年12月16日讯】中国互联网科技公司巨头字节跳动为了“抄近道”,违规使用OpenAI的技术来开发自家大模型。OpenAI宣布暂停字节跳动的GPT帐户使用权限,并对其“不正当行为”展开调查。
12月15日,美国科技新闻及媒体网络The Verge报导,字节跳动在未经OpenAI允许的情况下,一直在秘密使用 OpenAI 的技术来开发自己的竞争性大语言模型(LLM)。这些技术被应用于字节跳动的推荐算法、语音识别等领域,为公司带来了巨大的商业利益。
违规使用OpenAI技术研发自家模型 字节跳动GPT帐户被禁
(网页截图)
报导说,字节跳动的内部文件证实,该公司代号为“种子计划”(Project Seed)基础大语言模型项目中,几乎在每个开发阶段,包括训练和评估模型,都依赖 OpenAI API 来开发,而这些做法直接违反了OpenAI 的相关规定。
OpenAI 的服务条款有明文规定,该公司所输出的模型不能被用于“开发任何与我们的产品和服务竞争的 AI 模型”。字节跳动通过微软购买了 OpenAI 的访问权限,但是微软也制定了与 OpenAI 同样的政策。
报导还指出,字节跳动的员工在内部沟通平台上的对话显示,相关员工非常清楚这么做的后果。他们曾在群组中讨论如何通过“资料脱敏”来掩饰相关证据的问题。
这种滥用行为非常猖獗,以至于 “种子计划”的员工在使用过程中经常达到 OpenAI API 的最大访问上限。
字节跳动大约在几个月前下达了“模型开发的任何阶段停止使用 GPT 生成的文本”的命令。而正是在这个时候,字节跳动发布了自家大语言模型“豆包”(Doubao)。
资料显示,字节跳动的“种子计划”大约在一年前启动,目前主要研发两个产品,一个是在国内已经上线的“豆包”;另一个是针对商业用户的聊天机器人平台,目前正在开发中。
The Verge的报导还提到,一位对字节跳动内部情况有一手消息的人透露说,“他们(指字节跳动的员工)说,他们想确保一切(行为)都是合法的,但他们实际上只是不想被抓住把柄。”
在上述消息发表出来后,OpenAI 的发言人尼克・菲利克斯(Niko Felix)发表声明说,所有 API 客户必须遵守OpenAI的使用政策,以确保相关技术不会被滥用。目前,OpenAI公司已经暂停了字节跳动的GPT帐户使用权。
菲利克斯表示:“我们会进一步调查。如果我们发现他们的使用不符合规则,我们将要求他们进行必要的更改或终止他们的帐户。”
违规使用OpenAI技术研发自家模型 字节跳动GPT帐户被禁
(网页截图)
当地时间12月16日下午,字节跳动发言人针对The Verge的报导回应称,在“种子计划”的早期开发中,字节跳动曾把GPT 生成的数据用于注释模型,但这些数据已经在今年年中的时候“从字节跳动的训练数据中删除”。声明并称,“我们在非中国市场使用GPT支持我们的产品和功能;但在中国市场,使用我们自主开发的模型来支持豆包”。
此事曝光后,不仅在科技圈引起广泛关注,也在中国社交媒体上引发讨论。
有中国网友留言嘲讽字节跳动的回应:“偷过,现在没有了。”另一位网友则评论说:“你以为弯道超车是怎么超的?”还有网友调侃道:“一边被别人卡脖子,一边又说自己遥遥领先,是不是有点搞笑?”
违规使用OpenAI技术研发自家模型 字节跳动GPT帐户被禁
(网页截图)
(记者唐迪综合报导/责任编辑:云涛)