一項由史丹佛大學等機構聯合進行的新研究指出,Meta 旗下大型語言模型 Llama 3.1(70B)能準確重現《哈利波特:神秘的魔法石》高達42% 的內容,遠超早期版本的4.4%。此發現顯示,AI模型逐字保留受版權保護作品的能力,非科技公司所稱的「附帶行為」,而是訓練過程中明顯使用受歡迎作品的有力證據。
研究還發現,Llama 3.1 對作家凱德瑞的小說《Sandman Slim》幾乎無記憶,後者正是對Meta提起訴訟的原告之一。專家指出,這種記憶差異可能使集體訴訟更難統一處理,卻為個別版權主張提供實質證據。
美國著作權局也在最新報告中指出,若模型能重現大量受保護表達,其內部權重可能構成侵權複製。此前已有文件顯示,Meta使用來自Libgen等影子圖書館的盜版書籍作為訓練資料,引發全球出版界強烈反彈。
面對爭議與法律壓力,Meta正加速強化數據來源,傳以143億美元投資 Scale AI,並延後原訂於今年推出的Llama 4模型至 2025 年底。Meta在AI戰局中的後續動向備受關注。(編輯部)