多家主要出版商和作者聲稱 Meta 盜用數百萬本書籍來訓練其 Llama AI,加劇了價值數千億美元的 AI 行業所面臨的法律鬥爭。
返回
多家主要出版商和作者聲稱 Meta 盜用數百萬本書籍來訓練其 Llama AI,加劇了價值數千億美元的 AI 行業所面臨的法律鬥爭。

五家主要出版商和暢銷小說家斯科特·圖羅(Scott Turow)已針對 Meta Platforms Inc. 提起集體訴訟,指控該公司為了構建其 Llama 人工智能模型而進行了大規模的版權侵權。該訴狀提交至曼哈頓聯邦法院,認為 Meta 數十億美元的 AI 雄心是建立在盜版書籍和文章的基礎之上的,這對該公司在該技術上的巨額投資構成了直接威脅。
美國出版商協會主席瑪麗亞·帕蘭特(Maria Pallante)在聲明中表示:「Meta 的大規模侵權並非社會進步,如果科技公司優先考慮盜版網站而非學術與想象力,AI 將永遠無法得到正確實現。」
訴訟指控 Meta 的工程師使用 Anna's Archive(一個盜版內容搜索引擎)等存儲庫來獲取用於訓練 Llama 的未經授權作品。原告包括 Hachette、Macmillan 和 McGraw Hill,他們聲稱有數百萬部受版權保護的作品被使用,範圍涵蓋從教科書到 N.K. Jemisin 的《第五季》等小說。Meta 對這些指控表示異議,稱在受版權保護的材料上訓練 AI 可以屬於「合理使用」,並表示將「積極應對這場訴訟」。
此次法律挑戰發生之際,Meta 正在大幅增加其對 AI 的財務投入,預計全年資本支出將達到 1,250 億至 1,450 億美元。該訴訟尋求未具體說明的金錢賠償,但類似的案例凸顯了可能面臨巨額罰款。在針對 Databricks 的另一起案件中,一位版權律師指出,潛在賠償金額可能是「非同尋常的」,每件侵權作品的賠償金額最高可達 15 萬美元,這一數字可能「清算公司的所有資產」。
針對 Meta 的這起案件是科技公司與版權所有者之間圍繞大語言模型訓練數據展開的一系列高風險法律鬥爭中的最新一例。包括 OpenAI、Anthropic 和 Databricks 在內的公司都面臨過作家、藝術家和新聞機構提出的類似侵權指控,這為蓬勃發展的 AI 行業創造了複雜且不確定的法律環境。
法院尚未就使用受版權保護的作品進行 AI 訓練是否構成「合理使用」達成共識。然而,財務風險正變得越來越清晰。由亞馬遜和谷歌支持的 Anthropic 最近同意設立一個 15 億美元的基金,用於在解決集體訴訟性質的盜版官司中補償作者,這被認為是此類官司中首個重大和解。這為正面臨自身法律鬥爭的 Meta 樹立了一個昂貴的先例。
該訴訟直接針對 Meta 當前戰略的核心,即斥資數千億美元建設 AI 基礎設施。該公司最近啟動了規模高達 250 億美元的債券發行,以資助這些努力,儘管投資者已對缺乏明確的變現路徑表示擔憂。首席執行官馬克·扎克伯格(Mark Zuckerberg)承認,他對於擴大 AI 產品規模還沒有「非常精確的計劃」,這一表態在上次財報電話會議後導致公司股價下跌了 10%。
如果法院做出不利於 Meta 的裁決,該公司可能被迫支付數十億美元的賠償金,更關鍵的是,可能不得不在沒有爭議數據的情況下重新訓練其 Llama 模型。這將對其競爭 OpenAI 和谷歌等對手的地位構成重大挫折,並可能使很大一部分用於 AI 的巨額資本支出失效。此案凸顯了科技行業推動 AI 快速發展與保護知識產權的法律及倫理框架之間日益增長的緊張關係。
本文僅供參考,不構成投資建議。