多家主要出版商和作者声称 Meta 盗用数百万本书籍来训练其 Llama AI,加剧了价值数千亿美元的 AI 行业所面临的法律斗争。
返回
多家主要出版商和作者声称 Meta 盗用数百万本书籍来训练其 Llama AI,加剧了价值数千亿美元的 AI 行业所面临的法律斗争。

五家主要出版商和畅销小说家斯科特·图罗(Scott Turow)已针对 Meta Platforms Inc. 提起集体诉讼,指控该公司为了构建其 Llama 人工智能模型而进行了大规模的版权侵权。该诉状提交至曼哈顿联邦法院,认为 Meta 数十亿美元的 AI 雄心是建立在盗版书籍和文章的基础之上的,这对该公司在该技术上的巨额投资构成了直接威胁。
美国出版商协会主席玛丽亚·帕兰特(Maria Pallante)在声明中表示:“Meta 的大规模侵权并非社会进步,如果科技公司优先考虑盗版网站而非学术与想象力,AI 将永远无法得到正确实现。”
诉讼指控 Meta 的工程师使用 Anna's Archive(一个盗版内容搜索引擎)等存储库来获取用于训练 Llama 的未经授权作品。原告包括 Hachette、Macmillan 和 McGraw Hill,他们声称有数百万部受版权保护的作品被使用,范围涵盖从教科书到 N.K. Jemisin 的《第五季》等小说。Meta 对这些指控表示异议,称在受版权保护的材料上训练 AI 可以属于“合理使用”,并表示将“积极应对这场诉讼”。
此次法律挑战发生之际,Meta 正在大幅增加其对 AI 的财务投入,预计全年资本支出将达到 1,250 亿至 1,450 亿美元。该诉讼寻求未具体说明的金钱赔偿,但类似的案例凸显了可能面临巨额罚款。在针对 Databricks 的另一起案件中,一位版权律师指出,潜在赔偿金额可能是“非同寻常的”,每件侵权作品的赔偿金额最高可达 15 万美元,这一数字可能“清算公司的所有资产”。
针对 Meta 的这起案件是科技公司与版权所有者之间围绕大语言模型训练数据展开的一系列高风险法律斗争中的最新一例。包括 OpenAI、Anthropic 和 Databricks 在内的公司都面临过作家、艺术家和新闻机构提出的类似侵权指控,这为蓬勃发展的 AI 行业创造了复杂且不确定的法律环境。
法院尚未就使用受版权保护的作品进行 AI 训练是否构成“合理使用”达成共识。然而,财务风险正变得越来越清晰。由亚马逊和谷歌支持的 Anthropic 最近同意设立一个 15 亿美元的基金,用于在解决集体诉讼性质的盗版官司中补偿作者,这被认为是此类官司中首个重大和解。这为正面临自身法律斗争的 Meta 树立了一个昂贵的先例。
该诉讼直接针对 Meta 当前战略的核心,即斥资数千亿美元建设 AI 基础设施。该公司最近启动了规模高达 250 亿美元的债券发行,以资助这些努力,尽管投资者已对缺乏明确的变现路径表示担忧。首席执行官马克·扎克伯格(Mark Zuckerberg)承认,他对于扩大 AI 产品规模还没有“非常精确的计划”,这一表态在上次财报电话会议后导致公司股价下跌了 10%。
如果法院做出不利于 Meta 的裁决,该公司可能被迫支付数十亿美元的赔偿金,更关键的是,可能不得不在没有争议数据的情况下重新训练其 Llama 模型。这将对其竞争 OpenAI 和谷歌等对手的地位构成重大挫折,并可能使很大一部分用于 AI 的巨额资本支出失效。此案凸显了科技行业推动 AI 快速发展与保护知识产权的法律及伦理框架之间日益增长的紧张关系。
本文仅供参考,不构成投资建议。