OpenAI正与数十家出版商洽谈内容授权事宜

OpenAI表示,它正在与数十家出版商谈判,以达成协议,授权他们的文章,这是一个比之前所知的更广泛的努力,因为这家初创公司正在寻找内容来训练其人工智能模型。

“我们正在与许多发行商进行许多谈判和讨论。他们很活跃。他们非常积极。我们进展很顺利,”OpenAI的知识产权和内容主管Tom Rubin告诉彭博新闻社。

一位知情人士此前告诉彭博社,OpenAI最近与Politico的母公司Axel Springer SE签署了一项为期多年的许可协议,价值数千万美元。今年7月,OpenAI宣布与美联社(The Associated Press)达成一项协议,但未透露协议金额。这些交易对OpenAI的未来至关重要,因为它正在平衡对构建模型所需的更新、准确数据的需求,以及对数据来源的日益严格的审查。

但上周,与OpenAI进行过谈判的公司之一《纽约时报》(the New York Times Co.)起诉OpenAI和微软公司(Microsoft Corp.)未经许可使用该杂志的文章。

这起诉讼对 OpenAI 的业务构成了生存挑战。如果《纽约时报》胜诉,OpenAI 不仅可能欠下数十亿美元的债务,还可能被迫销毁任何包含《纽约时报》作品的训练数据,而这是一项昂贵而复杂的任务。然而,更直接的是,这起诉讼使 OpenAI 与媒体行业的交易变得更加复杂。

Rubin表示:“目前的情况与出版商过去在搜索引擎和社交媒体上面临的情况大不相同。在这里,内容是用来训练模型的。它不是用来复制内容的。它不是用来取代内容的。”

然而,《纽约时报》不同意OpenAI的立场,认为ChatGPT完全是在不付费的情况下抄袭其记者的作品。在诉讼中,出版商展示了ChatGPT几乎一字不差地从《纽约时报》上摘录整段文字的例子。出版商认为,这证明OpenAI使用了《纽约时报》的数据。

《纽约时报》在一份声明中表示:“如果微软和OpenAI想将我们的成果用于商业目的,法律要求他们首先获得我们的许可。但是他们却没有这么做。”