2023 年一場創作者與 AI 業者的戰鬥序幕正悄悄展開,本篇讓我們來看看,目前創作者與生成式 AI 的爭訟中,美國加州法院的最新認定,也觀察新興科技如何衝擊著現有的著作權法制度。
插畫家 Sarah Anderson 案
以插畫家 Sarah Anderson 為首,在加州聯邦法院對 Midjourney 提起集體訴訟,指控被告未經創作者同意,透過爬蟲技術使用數億張圖庫圖片,以訓練其所推出的「 AI 圖片生成器」(名為“Stable Diffusion”的人工智能平台),生成非法之「衍生著作」。主張被告直接或間接侵害著作權,違反著作權法、 DMCA(千禧年法案)、及不正競爭法。
喜劇演員 Sarah Silverman 案
喜劇演員 Silverman 與其他兩位書籍作者 Kadrey 和 Golden ,對 Meta 和 OpenAI 提起訴訟,指控他方在未經許可的情況下,使用其著作內容來訓練人工智能語言模型,該模型宣稱能夠透過複製人類對話自動執行任務。
Sarah Anderson's collection
美國加州法院怎麼看?
- Sarah Anderson 案中,法院要求原告應提出更多證據,以證明 AI 作品與原告著作構成「實質近似」的侵權要件
- 原告書狀中未提及任何 AI 生成內容。原告無法證明生成式 AI 的作品與其原著作有實質近似,原告未提出任何比對,自無所謂是否構成侵權。
- 原告應具體指出被告哪一個階段的行為有侵權?如何構成侵權?是基於 Midjourney 對 Stable Diffusion 的使用,還是基於 Midjourney 獨立使用訓練圖像來訓練 Midjourney 產品,或是兩者兼而有之?
- Sarah Silverman 案中,法院直指原告的主張是錯的:「原告認為生成式 AI 在訓練階段已大量重製其合法之作品,即無需主張 AI 產出與其原作實質近似。」亦即法院諭知,證明 AI 生成作品對原告著作構成實質近似的「質」與「量」比對,是原告應盡的舉證責任。
等等,在進入令人頭暈的討論前,我們先來補充一些著作權法的觀念
- 著作權僅保護表達,而不及於背後的原理、概念
- 若一概念之首次表達是源自於自然界,則該概念的表達即屬人類的公共財,不應由個人壟斷或獨佔,以免扼殺他人之創作自由。
- 因此在抄襲認定上,亦需區分作品中受著作權法保護之「具原創性的部分」,和原告著作加以比對。
- 什麼是「衍生著作」(二創)
- 依美國著作權法,衍生著作係基於既有作品,重新塑造、轉化、改編成任何形式之作品。
- 因此,衍生著作無論如何創新,和原作之間仍會有明顯對應的脈絡和關聯。亦即,衍生著作係奠基於原作的基礎上,添加一定的轉化元素,再現原作精髓,在表達層面上仍能看到原作的影子。(簡言之,如果 coser 跟原作完全不像,或難以聯想到原作,就不叫 cosplay 了吧!)
- 法院對於「抄襲」之認定:接觸+實質近似
- 所謂「實質近似」,係指「引用著作權人著作中實質且重要之表達部分,且須綜合『質』與『量』兩方面考量,為價值判斷,認為二者相似程度頗高,或屬著作之主要部分者,始足當之。」
- 舉例而言,如果從 1000 頁的論文中僅擷取一句話,在「量」的判斷上可能兩者不構成實質近似;反之,如果從四行詩句中使用一句話,相對而言具有相當的量,很可能成立「實質近似」。
- 另一方面,即使擷取的量不多,但如果就整體而言是精華或重要的部分,可能也會構成實質近似。又可設想如除去該部分,著作即失其精隨,其重要性可見一斑。
- 此外,著作的種類不同,實質近似的判準也有所差別
- 台灣高等法院曾認為: 「如對寫實之作品,往往保護程度較低,可以分析解構之方式逐一比對,細數相似成分之『量』;對美術、圖形等具藝術、抽象美感之著作,著作權法予以保護之程度較高」,
- 「在判斷圖形、攝影、美術、視聽等具有藝術性或美感性之著作是否抄襲時,如使用與文字著作相同之分析解構方法為細節比對,往往有其困難度或可能失其公平,因此在為質之考量時,尤應特加注意著作間之『整體觀念與感覺』。」
從美國案例的觀察與討論
- AI 生成作品恐難以構成著作權法的「衍生著作」
- 是否屬於衍生著作之認定,在於二創作品是否基於原創而來,兩者是否有對應的脈絡有跡可循?生成式 AI 產生圖像,是否包含原作足夠份量的元素在其中?如何回溯?在認定上實有難度。
- 其背後原理在於,AI 平台產出的成品並非抄襲自真實存在的作品(成品本身非資料庫之一),而是經由大量資料學習後,自行產出的。原理就像人類觀摩無數畫作學習內化後,再畫出一幅圖畫,而你很難回溯 AI 學習的每個階段,去勾稽兩者之間的脈絡。
- 主張生成式 AI 創作出「風格近似」之作品,現階段可能難以成立侵權
- 法院認為原告須舉證 AI 生成作品與原告之著作有「實質近似」,因此原告必須正面迎擊,在「質」與「量」的比對上說服法院。然而,在實際運作上,使用者對於生成式 AI 下指令:「以” Sarah Silverman 的風格“生成文本。」因著機器學習的原理,AI 的回覆可能與 Silverman 書中的任何段落,完全沒有任何相似之處,增加原告舉證的難度。
- 此外,「風格近似」本身是否得以主張侵權?本質上是否屬於“不受著作權保護的”概念或觀念之一環,在司法實務上仍有模糊和爭議的空間。
- 原告(創作者)可能的機會
- 整體而言,原告主張可分為兩階段:「AI 訓練階段」,未經創作者授權,大量重製合法作品以訓練 AI 模型的直接侵權;以及 「AI 生成作品階段」,生成式 AI 產出與原告作品風格相近似的衍生作品。
- 即便在 AI 創作階段,目前尚未能提出實質近似的有力證據,綠獅認為仍無礙另一直接侵權之主張:「被告未經創作者授權,大量重製其作品作為 AI 模型訓練之用。」
- 也回扣到上一篇的討論,未來是否可能發展出創作者與 AI 平台間的分潤機制(類似 Spotify 上架音樂的概念,創作者授權讓自己的作品訓練 AI,並獲取收益),讓創作者能和 AI 業者分享獲利,同時也能讓大眾享受 AI 的便利,營造出多贏的局面,值得觀察。相信這不僅是創作者,也是 AI 業者的機會。
小結
科技變化之快,法制的連動往往望塵莫及。不論是從 AI 作品是否應予保護、以及對於既有著作的侵權疑慮,似乎都可見現行著作權法制的保護傘,已漸漸難以周全。期待透過案例的持續關注,引起更多的前瞻與反思。