印度政府昨天发布的一份工作文件显示,该国希望AI公司为访问用于训练模型的内容付费,但仅在这些公司开始产生收入后。这一提案由印度工业和内部贸易促进部成立的生成式人工智能和版权委员会编写,试图在保护版权所有者利益与促进AI创新之间寻找平衡。

混合模式:三大核心要素

针对AI模型开发者大多未为受版权保护内容付费所引发的全球性辩论,委员会提出了一种包含三个要素的混合模型:

一揽子许可机制 – AI开发者可获得一揽子许可,使用所有合法获取的内容进行训练,无需单独协商每项内容的使用权。

商业化后付费 – 只有在AI工具商业化后才需支付版税,费率由政府指定的委员会制定,这些费率将接受司法审查。

集中式版税管理 – 建立统一机制负责版税的收取和分配,旨在降低交易成本,提供法律确定性,并支持大型和小型AI开发者公平获取资源。

CRCAT:拟议的版税征收机构

该报告为版税征收机构提出了具体名称——AI训练版权版税集体管理组织(CRCAT),并建议将其设立为由版权所有者协会组成的非营利组织。报告还提议建立"AI训练版税作品数据库",邀请内容创作者注册作品,以便有资格从CRCAT获得版税。

印度提出AI版权新模式:商业化后付费,建立统一版税机构

报告指出,该模式旨在"为AI开发者提供便捷的AI训练内容获取途径,简化许可程序,降低交易成本,并确保版权所有者获得公平补偿"。

印度政府认为,免费获取内容的"零价格许可模式"并不合适,因为它"会削弱人类创造力的动力,并可能导致人类生成内容的长期产量不足"。

委员会成员同时发现,"获取大量数据和高质量数据对于AI的发展至关重要",但他们担心就这些内容进行许可谈判可能会导致"漫长的谈判和高昂的交易成本,这可能会阻碍创新,特别是对于初创企业和中小微企业而言"。

拟议的安排并非没有先例。一些国家已设有表演权组织,负责向播放录制音乐的场所收取版税并分配给艺术家。类似机制也存在于新闻转载等领域。

印度的特殊性与前景

印度的情况带来了相当大的挑战,因为该国承认22种官方语言,其中8种语言的使用者超过5000万人,而且其媒体和出版生态系统庞大且分散。

尽管科技巨头们仍在激烈争论是否有权在不事先付费的情况下训练模型,但他们也在达成一些涵盖日常运营的交易。如果新德里能够支付合理的版税,这项提议或许会受到大型科技公司的欢迎。

印度政府已宣布该国将在AI的各个方面成为世界领导者,为实现这一目标,印度政府对进军本地市场的科技巨头采取了较为友好的态度。此次提案或将成为全球AI版权政策的重要参考范本。