出席經濟部智慧局114年4月14日生成式AI訓練與著作權議題之權利人意見交流會議發言要旨
作者:章忠信
114.04.14.完成
有著作權 侵害必究
ch7943wa@ms12.hinet.net
本案會議實在係因監察院糾正數發部、國科會、國家實驗研究院發展主權AI之TAIDE不力,但千萬不要為了發展具主權AI之TAIDE而犧牲著作權人利益。
依目前實務發展來看,取得授權並不難,難在利益有無適當分配及AI之利用是否值得信賴?至於授權金從哪裡來?也不是問題,因為發展AI或平台,也要資金,沒有授權金的資源,不該是個問題。歐盟人工智慧法案,只談尊重智慧財產權,沒說要修正著作權法,其實就是要大家依法授權,不期待透過新增合理使用條款來解決生成式AI之發展。
發展主權AI之TAIDE,應先從政府出版品開始,如果政府出版品都難以利用,遑論商業著作之合法利用。政府出版品的電子檔,在Open Data或Open Government的政策下,到底有多少可以自由利用?根據身心障礙者權益保障法第30條之2的規定,無障礙版本所需作為轉換基礎之政府出版品電子檔都已經是很缺乏了,要將政府出版品電子檔運用在TAIDE,就更不必說了。如果政府出版品通通以創用CC-by授權,就可以充實無障礙版本及TAIDE很多演算內容。數發部、文化部及科資中心等政府機關應該基於政府一體,協調各級政府之政府出版品電子檔統一平台之有效利用,不要各行其是,浪費政府資源。
身心障礙者權益保障法第30條之2第1項:
「經中央教育主管機關審定之教科用書,其出版者應於該教科用書出版時,向中央教育主管機關指定之機關(構)或學校提供所出版教科用書之數位格式,以利製作專供視覺功能障礙者及前條第一項其他特定身心障礙者接觸之無障礙格式。各級政府機關(構)出版品亦同。」
技術無可限制,未來有無限可能。技術上,訓練AI而利用著作,未來未必一定要重製著作。未來的可能,將如同人之閱讀,用眼睛看,深深印在腦海裡,並沒有重製。於是,人看書增長知識,就業賺錢,不必與著作權人分享利益。但在著作權法之立法上,反而需要思考,AI利用看書增長知識,不管有無重製既有著作,效果上如同人看書增長知識,也不管AI是收費還是免費提供公眾使用,是否真的不必與著作權人分享利益?這種潛在市場價值之利用,可能必須增加成為著作人之新權利。
目前很多生成式AI是使用網路開放資料,但網路開放資料只能自由瀏覽,不等於可以超越瀏覽而進行其他利用。我的「著作權筆記」內容也公開放在網路上,歡迎大家瀏覽,但我可沒同意大家做其他自由利用,包括訓練生成式AI。
有一種說法是著作權人可以標示他的著作不可以被利用於訓練生成式AI,或是要求退出,或是技術上設定不被用於訓練生成式AI,但第37條第1項後段「約定不明,推定為未授權」,怎麼解釋?有授權而說不清楚的,條文「推定為未授權」,根本沒授權的著作權人,真的一定要明示不被用於訓練生成式AI,才不能利用於訓練生成式AI嗎?還是說著作權人沒說可以利用的,就是不行利用?我們今日談的是法律規範及適用,而不是技術防制議題。不能說我的網頁沒有防止爬蟲程式的嵌入,大家就可以自由爬走,任意利用。
利用著作來訓練AI,不是資料探勘。資料探勘是指利用資料進行分析,以產生特定數據或統計結果,不是生成可以替代著作之內容,生成式AI生成之結果,或許不是救濟有著作之重製或改作,但會發生替代原著作之結果。
對著作權人來說,授權期間對AI訓練是沒有意義的。高中畢業後,將高中以下課本資源回收,高中生是否就沒有高中程度?同理,同意讓自己的著作被拿去訓練AI後,日後停止授權是否有意義?AI就不會理解先前授權的內容嗎?資料庫的資料必須不斷投入,資料庫才有價值。對訓練AI而言,也是如此,必須不斷投入有價值而即時的資料。所以,如何與資料庫業者合作,讓資料庫業者願意授權,將權利金從生成式AI開法者這邊,透過資料庫業者公平分享給著作權人,才是正辦。
著作權法賦予著作權人的著作權,說穿了就是著作利用之「控制權」及「利益分配權」。這兩者哪一個比較重要?當然是「利益分配權」。
為了發展主權AI,要透過合理使用剝奪著作權人的「控制權」及「利益分配權」,並沒有道理。
合意授權其實可行,Open AI早就與專業圖書出版社及新聞期刊談授權,不再使用網路上的垃圾資訊,以演算出優質內容。這種集中授權,透過出版社及期刊雜誌社,取得每一件著作之授權,正在進行中。
透過集體管理組織進行集體授權,不適不可能,雖然目前沒有對應的集體管理組織,但只要有需求,就會有市場;著作權人不透過集體管理,就收不到錢,自然就會成立集管組織。
如果為發展AI,讓他們使用網路上包括的垃圾資訊,因為不可能一一洽談授權,法定授權可以是一個選項。只要錢給得夠多,坦白說,保障了「利益分配權」,著作權人不會那麼在乎「控制權」。不過,這只是要解決一一取得授權的困難,但著作權人的權利仍應關注,就應該配套讓著作權人有「退出權」。因為,我可能不願意讓「著作權筆記」內容被拿去訓練AI,我認為大家有著作權問題還是應該來「著作權筆記」跟我討論諮詢,不該去問AI;或者,我認為「著作權筆記」內容很有價值,法定授權每篇只有給2元太少,我要自己來談每篇20元。