1月29日,彭博社援引知情人士的话报道,微软和 OpenAI 正在调查与DeepSeek 有关联的团体是否以未经授权的方式获取了 ChatGPT 制造商技术的数据输出。
微软的安全研究人员指出,去年(2024年)秋季,据信与 DeepSeek 有关的个人使用 OpenAI 的应用程序编程接口 API, 提取了大量数据。当时,针对这些可疑活动,微软(OpenAI 最大的投资者)通知了这家 AI 初创公司,其行为有可能违反其服务条款,或表明该组织可能已经规避了对访问数据量的限制。
OpenAI在使用条款中明确标明:"禁止[...]使用输出结果来开发与 OpenAI 竞争的模型“,”也不允许以自动或以编程方式 [提取] 数据或输出"。
号称“人工智能沙皇”,特朗普的专业顾问大卫·萨克斯(David Sac)周二(1月28日)说,有“大量证据”表明DeepSeek“从OpenAI的模型中蒸馏出知识”。蒸馏是一种机器学习技术,可将知识从较大的 AI 模型转移到较小的 AI 模型。大卫·萨克斯补充说,在接下来的几个月里,美国领先的人工智能公司将采取措施,防止数据蒸馏,这必定会遏制住山寨模式的发展速度。
事情的真相如何,我们只能拭目以待,但仔细一想,其中却充满了讽刺意味。 毕竟,正是在未经同意的情况下吸纳了整个网络中的文本,OpenAI 才实现了 GPT 模型的巨大飞跃。
对于这些指控,OpenAI方面一直坚称其AI系统利用的是“合理使用”的公开数据。在面对作家和新闻媒体的版权侵权指控时,OpenAI表示其训练模型时使用的受版权保护的内容属于“合理使用”,并认为这种使用是为了创作原创内容,符合版权法中鼓励创新和发展的目的。
在一些初步诉讼中,OpenAI也取得了一些胜利。例如,2024年11月,美国纽约南区地方法院驳回了新闻媒体Alternet和Raw Story对OpenAI的诉讼,认为原告未能证明其因版权信息被删除而遭受具体伤害。
这应了那句话:屠龙者终成恶龙。