在《纽约时报》起诉 OpenAI 的长期版权侵权诉讼中,案件取得了重大进展。据 Ars Technica 报道,审理此案的联邦法官已授权《纽约时报》及其共同原告《纽约每日新闻》和调查报道中心,访问 OpenAI 的用户日志,包括已删除的内容,以精确查明侵权范围。

OpenAI 版权诉讼新进展:《纽约时报》将可访问已删除的用户数据

《纽约时报》认为,ChatGPT 用户可能会在绕过付费墙后删除历史记录,因此有必要进行大规模的数据覆盖。该报进一步声称,这些日志的搜索结果可能成为整个诉讼的关键证据:OpenAI 的大型语言模型(LLM)不仅使用了其受版权保护的材料进行训练,还可能直接抄袭这些内容。这项命令已于上个月发布,并在 OpenAI 试图上诉后于本周获得确认。

OpenAI 对此深表不满。上个月,该公司声称这项命令将迫使其绕过“长期以来的隐私规范”。在最新裁决公布后,OpenAI 的一位发言人告诉 Ars,他们打算“继续抗争”。

值得注意的是,这一裁决是在《纽约时报》等出版商与 OpenAI 协商如何处理数据库搜索之际做出的。正如 OpenAI 上个月在一份声明中指出的那样,该命令涵盖了从免费的 ChatGPT 日志到使用其 API 的用户的更敏感信息。(该命令特别指出,ChatGPT Enterprise 和 ChatGPT Edu,即其专为高校定制的模型,的日志将不受限制。)

除了寻找版权侵权的证据,OpenAI 的日志策略也可能有助于证明 ChatGPT 通过在聊天机器人内总结文章来稀释新闻市场,这最终导致媒体机构广告收入的损失,因为它们的链接被潜在读者完全绕过。据 《福布斯》 报道,今年早些时候,内容授权平台 TollBit 发现,OpenAI、谷歌和其他公司的聊天机器人向出版商发送的流量比传统搜索引擎少 96%——这一趋势已开始对新闻行业造成损害。

在文字提供者和人工智能之间的这场“生存斗争”中,市场稀释的证据可能会使天平偏向版权持有者,正如上个月一位法官告诉起诉 Anthropic 的出版商那样——这对于任何试图绕过付费墙的用户来说,都将产生重大影响。