生成式人工智能因其可靠性不足、巨大能耗以及未经授权使用版权材料而备受争议。然而,最近一起针对人工智能公司 Anthropic 的法庭案件揭示了一个更令人震惊的真相:为了训练其 AI 助手,该公司竟然销毁了数百万本实体书籍。

在这起案件中,法官发现 Anthropic 为构建其语言模型 Claude,进行了大规模的书籍销毁行为。这家科技公司购买了大量实体书籍,随后通过撕下装订线和扫描书页的方式将其数字化,这一过程不仅彻底毁坏了这些书籍,还没有打算将最终的数字版本公开。这样的做法在法院判决 Anthropic 胜诉的过程中起到了重要作用。法官认为,这种数字化处理构成了充分的转化,符合合理使用的规定。

然而,尽管 Claude 能够利用这些数字化书籍生成独特内容,批评人士指出,大型语言模型仍有可能在其训练过程中逐字复制内容。Anthropic 的部分法律胜利使其能够在不通知原出版商或作者的情况下,利用受版权保护的书籍进行 AI 模型训练,这可能会消除生成 AI 行业面临的一大障碍。

惊天内幕!Anthropic 因训练 AI 销毁数百万本书籍,版权纠纷再升级!

值得注意的是,Metal 的一位前高管曾表示,如果 AI 必须遵守版权法,整个行业可能会在一夜之间崩溃,因为开发人员将难以获得训练大型语言模型所需的庞大数据。而持续的版权纠纷也给这一技术的发展带来了巨大威胁。近期,Getty Images 的首席执行官也承认,公司无法承担所有与 AI 相关的版权侵权费用。与此同时,迪士尼对图像生成公司 Midjourney 的诉讼,展示了图像生成器复制受版权保护内容的能力,这可能会对整个生成 AI 生态系统产生深远影响。

尽管法官判决 Anthropic 在部分问题上败诉,指出该公司依赖盗版图书库训练 Claude,但该公司仍需在12月进行版权审判,届时可能面临每部盗版作品高达15万美元的赔偿金。这场版权争斗无疑将为生成式人工智能的未来蒙上阴影。