近期國內有大老倡導 要成立台灣的主權AI 對抗中國的DEEPSEEK,然而除了硬體(夠多的算力)及軟體(演算法)的人才,更需要思考的是繁體中文的合法取用資料,是否充足?法制面上的準備又是如何?
畢竟Garbage in Garbage out 沒有足夠的合法資料 是不足夠訓練新的LLM
然而我國著作權法 並沒有TDM資料探勘等合法例外規定(如日本版權法 及 EU COPYRIGHT directive)
資料的合法取得 變成了灰色空間 只能靠法院以合理使用個案判斷
然而是否有沒有其他的路 或是讓著作權人有另外一種機制將自己的權利適當的分享呢?
記得在2006年左右 我無緣參加的創用CC plus計畫 或許是一個解法
而最近歐陸的研究圈也有提出相關的論述,以下是簡單描述其論述:
1.歐盟版權保護與新興法規
歐盟現行的版權法賦予創作者高度保護,同時通過例外與限制(如文字及資料探勘的例外)促進公共資訊獲取。然 而,隨著 AI 技術發展,歐盟正透過 AI 法案引入針對 AI 生成內容與一般用途 AI 模型提供者的新規範,儘管這些規範並未根本改變現有版權體系,但引發了業界對未來版權平衡的再思考。
2.Creative Commons 與 CC-Plus 的角色
CC 授權:作為促進內容共享與再利用的重要工具,CC 授權讓創作者能夠選擇不同的授權模式,以平衡公開分享與商業利益的需求。
3.CC-Plus 協議:該協議作為對傳統 CC 授權的補充,允許創作者在核心授權條款之外增加額外規範。例如,某些 CC 授權(如 CC-BY-NC、CC-BY-ND)可能已被解讀為限制用於 AI 模型訓練,而 CC-Plus 協議則提供了明確表達這類限制的可能性,既保護創作者權益,也不阻礙公眾對內容的合理使用。
4.雙方需求的平衡
文中強調,既要保障創作者的經濟利益與知識產權,又要維持公共對知識與信息的廣泛獲取。否定 CC 授權可能導致信息封閉,進而影響數位社會的開放性與創新活力。
以上完整內容可以洽KU LEUVEN CITIP研究中心BLOG查詢
https://www.law.kuleuven.be/citip/blog/the-return-of-cc-plus-a-necessary-step-for-ai-and-copyright/