3月18日,蘋果公司因涉嫌使用含有盜版書籍的“The Pile”數據集進行人工智能訓練,再次被心靈雞湯出版社(Chicken Soup for the Soul, LLC)列為版權侵權訴訟的被告方。此次訴訟規模龐大,除蘋果外,meta、xAI、谷歌、Anthropic、OpenAI、Perplexity及英偉達等全球頂尖科技巨頭均在訴訟名單之列。案件的核心爭議點在于該數據集中名為“Books3”的影子圖書館模塊,其包含了大量受版權保護的文學作品。
針對指控,蘋果公司重申其自2024年起便致力于以合法且合乎道德的方式構建AI數據集。盡管蘋果研究人員曾在OpenELMs開源項目中使用過“The Pile”數據,但官方強調該項目僅供公開研究,并未用于驅動核心的Apple Intelligence系統。然而,法律界分析認為,由于蘋果的基座模型曾借助Google Gemini進行輔助訓練,若谷歌在此案中被判定違規,蘋果可能因技術供應鏈的聯結而面臨復雜的連帶法律責任。
目前,Perplexity等公司已為其網絡抓取行為辯護,而蘋果則堅持其訓練模型的透明度與合規性。隨著AI監管環境收緊,這起針對底層訓練數據的集體訴訟,不僅標志著創作者群體對科技巨頭“數據掠奪”的反擊升級,也將迫使行業重新審視模型訓練中“數據溯源”的合規成本與技術邊界。








