2026年4月9日 星期四

趙坤茂/AI盜書練神功 回吐金丹求和

◆  趙坤茂/AI盜書練神功 回吐金丹求和
◆  王文華/人生的第二場比賽
◆  方祖涵/好壞球之後的下一個挑戰
◆  施振榮/品牌國際化 為世界貢獻更多








趙坤茂/AI 盜書練神功 回吐金丹求和

2026-04-09 00:00  聯合報/ 趙坤茂(作者為台大資工系教授)


訓練全能型的 AI 工具,需要超級巨量圖文資料,其中浩瀚書海可說是品質極高效率極佳來源,全球資訊科技巨擘無不想方設法,將各類書籍融入自家的大型語言模型中。然而,近年來使用書本訓練大型語言模型,卻引發諸多著作權糾紛,相關訴訟案件刻已進入關鍵司法裁決和解階段;其中,備受矚目的 Bartz v. Anthropic 案深具指標意義。

民國一一三年(二○二四年)八月,Andrea Bartz 等三位作家控告 AI 新創巨頭 Anthropic,在訓練大型語言模型 Claude 時,從 Books3 等「影子圖書館」(線上盜版資料庫)抓取並複製超過七百萬本受版權保護的書籍,已然構成大規模的侵權行為。原告主張這類型的機器學習並非單純的學習行為,而是建立在大規模盜版複製上的侵權商業開發。民國一一四年(二○二五年)六月,法院裁定機器學習訓練行為,本身如同人們讀書一般,其「轉化性」屬合理使用範疇;但為了訓練模型而從影子圖書館下載並儲存盜版資料行為,則不具備法律正當性,使得該公司面臨巨大侵權賠償風險

民國一一四年(二○二五年)九月,Anthropic 為了避免敗訴風險,同意支付約十五億美元賠償金和解,創下史上 AI 著作權的天價賠償紀錄。此外,該公司承諾銷毀所有從盜版來源取得的資料及衍生副本,並將建立更嚴格的版權過濾機制,以防止未來再次侵權。至於這筆十五億美元的賠償金是如何估算而得的呢?它是由符合賠償資格大約五十萬本書籍,再乘上每本賠償三千美元所得到的金額。蓋本案指控的七百多萬本下載量,在剔除重複檔案政府公文公有領域作品後,若僅針對在美國著作權局註冊、且擁有 ISBNASIN 編號合規版權書籍來計算,則可縮減至約五十萬本理賠對象

至於每部合格作品三千美元的賠償標準,則是根據美國著作權法中的「法定損害賠償金」進行議價。考量公司財力與五十萬本作品的規模,雙方最終折衷出一個既能展現懲罰性、又在公司可承擔範圍內的和解金額。符合資格的作者與出版商須在民國一一五年(二○二六年)三月前,透過官方和解網站提出理賠申請,待審核通過扣除律師費用後,賠償金才會分發下來。

前陣子筆者收到來自西雅圖的明信片,告知先前曾寄發 Bartz v. Anthropic 和解案通知,並再次提醒三月底前上網申請才可取得首波理賠。在排除網路詐騙的可能性後,筆者登入官方網站,才得知原來是自己的某本專書被侵權,可據以提出理賠申請。明信片上的英文住址只有巷弄、沒有路名,而我們的郵差竟還能送達,真令人折服

今年初,史丹佛與耶魯研究團隊證實,主流大型語言模型在巧妙引導下,竟能近乎逐字複誦暢銷小說的篇章,更讓人質疑全能型 AI 系統,根本上恐已違法暗藏受版權保護的作品。在金庸小說中,當張無忌的太極劍法從「全都記得」到「忘得一乾二淨」時,開山祖師張三丰才認可他已達到「無招勝有招」的武學最高境界,或許這般「得意忘形」的功夫值得 AI 借鏡。