作者:
EPika (精靈皮卡丘)
2025-02-10 08:27:42祖克柏批准 Meta 使用「盜版」書籍訓練 AI 模型,作家提告
莎拉·席佛曼等人在法院提起訴訟,聲稱 Meta 執行長批准使用受爭議的數據集,儘管內部
曾有警告
撰文:丹·米爾莫(Dan Milmo)與通訊社報導
發佈時間:2025 年 1 月 10 日(星期五)13:09 GMT
Meta 執行長 馬克·祖克柏(Mark Zuckerberg) 批准該公司使用「盜版」版權書籍來訓練
其人工智慧(AI)模型,一群作家在美國法院的訴訟文件中如此指控。
該文件引用了 Meta 內部通訊,聲稱祖克柏支持使用 LibGen 數據集(Library Genesis,
圖書創世紀),這是一個龐大的線上圖書庫,儘管該公司的 AI 管理團隊曾警告這是一個「
我們明知為盜版」的數據集。
根據訴訟文件,內部訊息顯示,使用包含盜版內容的數據庫可能會削弱 Meta(Facebook 和
Instagram 母公司)與監管機構的談判立場。文件中提到:「如果媒體報導我們使用了我
們明知為盜版的數據集,例如 LibGen,可能會削弱我們與監管機構的談判地位。」
作家對 Meta 提起訴訟
美國作家 塔-內西·科茨(Ta-Nehisi Coates)、喜劇演員 莎拉·席佛曼(Sarah Silverman
) 等人於 2023 年對 Meta 提起訴訟,指控該公司濫用他們的書籍來訓練 Llama(Meta 的
大型語言模型,Llama chatbot 的核心技術)。
Library Genesis(LibGen) 是一個源自俄羅斯的「影子圖書館」,聲稱擁有數百萬本小說
、非小說書籍和科學雜誌文章。去年,紐約聯邦法院裁定,LibGen 的匿名運營者需向一群
出版社支付 3,000 萬美元(約 2,400 萬英鎊) 的版權侵權賠償金。
在 AI 訓練數據領域,是否能使用受版權保護的內容已成為法律戰場。許多創意工作者和出
版商警告,未經授權使用他們的作品來訓練 AI,正在威脅他們的生計與商業模式。
Meta 內部文件曝光
訴訟文件引用的一份備忘錄提到:「在提交給 MZ(馬克·祖克柏)批准後,Meta 的 AI 團
隊已獲准使用 LibGen。」
文件還引用了內部通訊,顯示 Meta 工程師曾討論如何存取和審查 LibGen 數據,但有些人
對此感到猶豫,因為 「使用公司筆電進行 Torrent(點對點檔案分享)感覺不太對勁。」
法院審理進展
去年,美國地方法官 文斯·查布里亞(Vince Chhabria) 駁回了部分對 Meta 的指控,包
括 Meta AI 生成的文本是否構成版權侵犯,以及該公司是否非法移除了書籍的 版權管理信
息(CMI)(例如標題、作者名稱和版權擁有者資訊)。然而,原告獲准修改訴狀,重新提
出相關指控。
本週,這些作家團體表示,最新的證據進一步強化了他們的侵權主張,並應當恢復他們對 C
MI 的指控,甚至新增 「電腦詐欺」 相關指控。
查布里亞法官在週四的聽證會上表示,他會允許作家團隊提交修正後的訴狀,但對詐欺和 C
MI 指控的有效性仍抱持懷疑態度。
Meta 方面尚未對此事發表評論。
(此報導參考了路透社資訊)