一项来自纽约州立大学石溪分校和哥伦比亚大学法学院的最新研究显示,**通过少量数据微调的人工智能模型,能够以著名作家的风格生成令读者更加青睐的作品,甚至胜过人类专业模仿者。**这一发现不仅展示了生成式AI在文学创作模仿上的惊人能力,也为美国正在审理的版权诉讼和“合理使用”辩论带来了关键性的影响。

99.7%成本差!AI模仿作家风格更受青睐,直指“合理使用”边界引爆版权诉讼

研究方法:AI与人类专家同台竞技

研究人员使用GPT-4oClaude3.5SonnetGemini1.5Pro三大AI系统,以及专业作家,以包括诺贝尔奖得主韩江和布克奖得主萨尔曼·拉什迪在内的50位知名作家的风格创作文章。

实验中,研究团队采用了两种AI生成方法:

  1. 情境提示(Contextual Prompting): 使用GPT-4o、Claude3.5Sonnet和Gemini1.5Pro,提供相同的指示和示例文本。

  2. 针对性微调(Fine-Tuning): 仅使用支持API功能的GPT-4o,购买了30位作者的电子书,并对模型进行针对性训练,令人惊讶的是,即使是托尼·图拉西穆特(Tony Tulathimutte)这样仅出版过两本书的作家,其模仿效果也与村上春树等多产作家一样好。

核心发现:微调后AI作品受读者青睐

159名参与者(包括28位写作专家和131位非专家)在不知道文章作者是人类还是AI的情况下对作品进行了并排比较和风格评估。结果表明:

  • 基础AI输出: 在基本提示下,专家读者强烈倾向于人类撰写的文本。

  • 微调后AI输出: 结果发生颠覆性变化。经过微调后,**专家选择AI撰写文章的概率在风格方面增加了八倍,在写作质量方面也增加了一倍。**专家和非专家读者在风格和质量上都更青睐AI生成的文本。

  • AI检测失灵: 现代AI检测器将97%的标准AI输出标记为机器生成,但对微调后的AI作品,**只有3%**被识别出来,显示其“以假乱真”的能力。

研究指出,通用AI输出常见的“陈词滥调和不自然礼貌”等问题,通过针对性训练得到了显著改善。

成本巨大差异:AI模仿仅需人类费用的0.3%

该研究还揭示了巨大的成本差异:训练AI模型适应一位作者的风格,每位作者的成本约为81美元;而人类专业人士创作相同数量模仿文本的收费高达2.5万美元,AI将费用降低了99.7%

影响深远:文学模仿作品挑战“合理使用”

研究人员强调,这些结果为美国法院正在审理的AI公司如何使用版权材料的诉讼提供了关键论据。如果读者更喜欢AI创作的模仿作品,这可能构成对原创作品市场的明显“损害”,直接挑战了“合理使用”的核心法律原则。

美国版权局此前已警告,即使AI并非逐字抄袭,也可能挤占原创作品市场。研究作者建议,法律应区分通用AI模型和专门用于模仿特定作者的模型,并提出针对性模仿行为几乎没有法律依据,应考虑禁止AI抄袭个别作者的作品,或要求对AI生成文本进行清晰标注。