生成式AI的合理使用可能
作者:章忠信
有著作權,侵害必究
完成日期 112.08.24. 最後更新112.08.29
ch7943wa@ms12.hinet.net
生成式AI運用廣泛,但生成式AI必須先經過訓練學習階段,若訓練資料為他人著作,是否構成「重製」著作之行為?有無合理使用之可能?是不是該立法來處理這項爭議,以利生成式AI技術之發展?如果AI生成成果構成侵害著作權,又該由誰來承擔侵權責任?
一、訓練生成式AI是對於著作的重製行為嗎?
科技一日千里,法律修正前,有其不變之法律適用,但適用法律之前,應先確認事實,始能正確適用法律。
關於生成式AI於訓練學習階段,是否涉及「重製」他人著作之行為,應視其技術上如何處理,無法一概而論。
著作權法所定義之「重製」,依第三條第一項第五款前段之定義,指「以印刷、複印、錄音、錄影、攝影、筆錄或其他方法直接、間接、永久或暫時之重複製作。」
將他人著作掃描或複製,儲存於系統中,以供生成式AI訓練學習,乃構成「重製」他人著作之行為。
若並未直接掃描或複製他人著作以儲存於系統中,僅係以光學影像技術,讀取他人著作之後,自動編譯、轉換成其他特定數據,儲存於系統中,以供後續演算之用,應不至於構成「重製」他人著作之行為。
進一步言,若其於技術上之設計,使生成式AI如同人類瀏覽、接觸網路公開資料,即可完成訓練學習,並進行資料演算,生成一定成果,系統上並無資料儲存,即無任何「重製」他人著作之行為。
法律的規定及適用,有其一貫之原則,不必為不同科技而改變。事實上,科技與法律是有連動關係的,當法律之規定無意改變,科技自然會做快速調整。
二、生成式AI於訓練階段利用他人著作,與「資料探勘」不同。
生成式AI模型於訓練階段利用他人著作,應不同於國際間立法所指之「資料探勘」之態樣。
歐盟將「文字探勘」及「資料探勘」,結合成「文字或資料探勘(text and data mining, TDM)」,依據歐盟2019年「數位單一市場著作權指令(The Directive on Copyright in the Digital Single Market, 2019/790/EU)」第2條之定義,「文字或資料探勘」,係指「任何自動分析技術,其目的在分析數位格式之文字或資料,以產生包括但不限於規律、趨勢或關聯之資訊(any automated analytical technique aimed at analysing text and data in digital form in order to generate information which includes but is not limited to patterns, trends and correlations.)」其目的在於根據既有數位資料,經過搜尋、統計、分析,以獲得一定結果,並不在完成任何創作。
指令第3條及第4條就「文字及資料探勘」之利用為規定,要求各國應立法,允許研究組織為科學研究而需進行文字及資料探勘時,得重製、擷取著作。
上述「文字或資料探勘」之重製權之例外,具體案例如下:
(一)將一份文件儲存於資料庫中,透過電腦程式檢索,了解某一個特定詞彙(例如,合理使用),在該文件中出現多少次。
(二)將一定期間內之文件儲存於資料庫中,透過電腦程式檢索,了解某一組特定詞彙(例如,番、蕃、山胞、原住民、原住民族;匪區、鐵幕、淪陷區、大陸、中國大陸、中國),於不同時期之使用演進情形,以提供研究者掌握社會觀念或制度之發展脈絡。
生成式AI之自我訓練,係以機器學習之演算,分析大量資料、影像及內容等,進而利用這些資訊,產生與既有內容相近之新內容,不單純僅是文字或資料之檢索或分析,應不適用歐盟指令所允許之重製權之例外規定。
我國是否引進國外「資料探勘」合理使用之立法例,固得以討論研析,但該議題應與為發展生成式AI,是否應引進合理使用規定之政策無關。
三、生成式AI於訓練階段利用他人著作,縱屬「轉化性利用」,也未必是合理使用。
生成式AI於訓練階段利用他人著作,得否構成「合理使用」,發生爭議時,應由司法機關依據體個案事實,本於權責於具體案件中認定。目前,我國司法實務,尚無認其可屬「轉化性利用(transformative use)」而適用著作權法第65條第2項概括性合理使用之案例。
著作之利用是否構成「合理使用」,著作權法第65條第2項規定,「應審酌一切情狀,尤應注意下列事項,以為判斷之基準:一、利用之目的及性質,包括係為商業目的或非營利教育目的。二、著作之性質。三、所利用之質量及其在整個著作所占之比例。四、利用結果對著作潛在市場與現在價值之影響。」依據上述判斷基準,生成式AI模型於訓練階段利用他人著作,衍生出嶄新且重大之經濟利益,縱使係「轉化性利用」,因已具鉅大之「著作潛在市場與現在價值」,應亦難以通過第四項之考驗而被認定構成「合理使用」。
主張應讓AI之訓練合理使用他人著作,有一部分原因是因為取得授權不易,將阻礙AI技術及產業之發展,這說法也不成理由,可以修法引進法定授權制,使AI開發者不必一一取得授權,直接使用就可以,但要支付使用報酬費給著作權集體管理組織,不能獨佔AI開發的好處,錢要拿出來與著作權人分享。這筆錢不一定要分配到個別著作權人身上,因為個別分配成本太高,著作權集體管理組織可以將使用報酬使用於對全體著作權人有益之活動上,例如,鼓勵創作新人、扶助老弱創作者、著作權保護宣導、立法加強保護之遊說活動。同時,著作權人應有權要求退出,不被用於AI訓練。
四、AI生成之成果利用他人享有著作財產權之著作,未必能合理使用,如構成侵權,使用人應承擔侵權責任。
著作權法第10條之1規定,著作權法僅保護著作的「表達」,不保護「表達」所傳達的「概念」或「風格」。AI生成成果,理論上係依據既有資料之演算結果,並非係就既有資料之「表達」直接複製、貼上後,再行輸出。該項成果或許於「概念」或「風格」上,將與既有資料相同或類似,但應不至於發生直接再現既有資料「表達」的情形,不涉及著作權法中的著作利用行為。
如使用者明白要求AI依既有著作進行「重製」或「改作」,仍有可能發生利用既有著作之「表達」之「重製」或「改作」,須進一步討論有無合理使用或是否構成侵害著作權之議題。
AI生成成果,無論是否成為著作,若發生侵害著作權情形,應由利用該項成果之人承擔侵權責任。如同委託他人完成成果後,無論其委託之要求是否具體要求受託人就既有著作加以「重製」或「改作」,或僅係做原則性需求之指示,其後完全由受託人自行獨立完成受託之成果,凡委託人將委託成果公開使用,對外即須承擔侵權責任。其固然可能因為係受託人之侵權,委託人自己無侵權之故意或指示,無須承擔侵害著作權之刑罰責任,但只要委託完成之結果構成侵害著作權而委託人又將其公開使用,委託人即應承擔民事責任。至於對外承擔損害賠償責任之後,對內如何向應負最後責任之人求償,則屬另一問題。
由於委託他人完成成果時,雙方多會在委託契約中約定,由受託人擔保無侵害他人權益情事,並承諾承擔損害賠償義務。如AI使用條件未有類似保證,其生成成果僅供使用人私下參考,則使用人將該項成果公開利用時,應自行承擔侵權風險。從而,使用AI必須理解其生成成果之後續使用範圍,如欲公開使用,應特別評估其可能發生之風險。
合理使用之判定,須先使讀者知悉所引用之部分,係他人受著作財產權保護之著作,再進一步判定該項引用是否合理。
AI生成成果「重製」或「改作」他人享有著作財產權之著作時,如未註明出處,使公眾誤以為係使用該AI生成成果之人之著作,使用人即構成侵害他人之「重製權」或「改作權」,應承擔侵權之民事責任,並視其有無侵害之故意,決定應否承擔刑事責任。
至於AI本身,僅係一項工具,非權利義務主體,無從承擔任何法律責任;又AI模型之開發者,完成一項工具後,對於他人如何利用該項工具生成何種成果,並無控制權,基於科技中立原則,其既非AI成果生成者,於現行法律規範下,亦無任何法律責任。