前言
2023上半年,你可以看到一堆AI「鬼故事」,包括AI孫燕姿翻唱他人歌曲、AI德瑞克(Drake)與AI威肯(The Weekend)合唱新歌<Heart on my Sleeve>等事件,造成全球空前劇烈的關注,當然也衍生諸多討論與爭議。若我們把AI應用從「音樂」升至「聲音」的維度中討論,遇到的不只是「像不像歌手本人」或「是否侵犯著作權」等法律問題,可能提高到「人格權」層次的討論,如同程式語言不只是著作權保護問題,更像英文或德文等語言一樣,應受到言論自由或「基本權利」的保障。
轉型困境與定律
在講AI音樂與聲音的法律議題之前,我們必須認知一點事實,那就是AI的廣泛應用與影響會帶來「典範轉移」,很多人事物均會受到衝擊與取代,如同古代的「馬車」之於現代的「汽車」,但馬車從交通工具變成觀光用途,汽車從交通工具變成多功能的物品,其實都是「轉型」的過程。這些均與數位轉型及其法律議題息息相關。
而「轉型」的第一步,就是學會以「降維」與「升維」來擴張思考的維度,因為每增加一個思考維度,就會擴大我們的利基寬度。我們人類物種及世界社群,已經生存在一個「組織生態圈」,生物與生態之間會在彼此的互動中不斷演化,逐漸轉型成適應新文明的新物種。人類物種面對不確定性,靠的是思維與演化。思維就是思想的維度,學術理論在降維,實務運作應升維。「降維打擊」是減少一個對於對手至關重要、但對我無關緊要的維度。「升維打擊」是增加一個對手無法做到的維度,使得對手看不見敵人。
AI從音樂到聲音的模仿與生成,就是降維打擊,例如對孫燕姿很重要,但對AI或有心人士甚至大多數的人而言,無關緊要;反之,對AI或有心人士甚至大多數的人而言,AI從音樂到聲音的模仿與生成,就是升維打擊,增加一個孫燕姿無法做到或抵抗的時空場域,也看不見、摸不著AI音樂或聲音的幕後者。也因此,孫燕姿本尊在得知自己的AI版本在網上瘋傳後,就在她微博發表感慨長文,表示在這萬物皆可複製的現代,已經沒有人是特別的,覺得「畢竟該怎麼跟一個每幾分鐘就能推出一張新專輯的『人』比呢?」。
我們應該怎麼來看這些爭議
一、AI音樂的著作權法爭議
目前來說,以AI工具去生成音樂或聲音內容,早已不是稀奇的事情,例如疑似美國饒舌歌手阿姆(Eminem)的聲音,曾唱過一段從頭到尾只與貓有關的Rap歌曲。但說穿了,關於AI音樂,全世界的法律見解都正在等美國正進行中的相關審理案件,所以還沒定論。也就是目前AI音樂似乎仍遊走於法律的灰色地帶,能否受到著作權法的保障,仍未確定。
我們先來說說AI「音樂」的法律爭議,其中分成兩個層次。首先,開發人員是否在AI模型訓練過程中侵犯既有資料的著作權。許多音樂著作權人自己公布在網路上的作品,成為他人訓練AI音樂的資料(即「重製」或copy),也就是透過一些媒介或載具去接觸到原作,隨後這些AI工具接著可依該人的指令,在短時間內生成自己風格的作品,屬未經原作者同意而使用其著作。
然而,依照以往類似可參考的美國指標判決意旨可知,訓練AI的過程可能符合著作權法的「合理使用」原則,而且生成的新作品不是對原作的copy,而是一種「衍生」。況且,AI機器學習吸收龐大資料庫內的資訊,藉此生成新的內容,此與人類從前人的作品中學習、汲取靈感,並創作出自己的作品,沒有太大差別。甚至可說風格或聲音都是可以合法模仿的。
另一個層次的法律爭議是,AI生成的作品是否受著作權保護?目前全世界立法例、通說與實務,大多認為著作權法只保護「人類」作者,包括日前美國著作權局就指出,AI生成的視覺圖像作品不能獲得著作權保護。不過該局也指出,人類與AI合作完成的作品(包括音樂)能否擁有著作權保護,關鍵會在人類的創意干預或介入指令。換句話說,即使目前法律尚未有明確界線,但如果人類主導的成分愈重、AI作為輔助性工具的角色愈鮮明,就愈有可能爭取到著作權的保護。
二、AI聲音的法律爭議
(一)現行法律制度
至於我先前有看到人說「學人家的聲音(風格或唱腔)不犯法,但AI在學習聲音時會重製人家音樂,可能觸犯著作權法」,是這樣嗎?前者我認同,但後段我保留。首先要釐清的是,音樂歸音樂、聲音歸聲音,音樂是著作,但聲音是風格、特色,甚至是生物特徵,二者唯一的交集,就是AI在生成音樂與聲音的過程,有沒有copy到歌手本人或音樂著作權人的數位資料與檔案。
因為如果只學某一個人的聲音,就AI技術而言是非常簡單,大概只要擷取那個人每首歌的一丁點片段音頻/聲紋即可,那就每一首歌而言,被擷取的質量恐怕也很難構成copy,就算未經同意的重製,應該也符合「合理使用」原則,而難謂侵害著作權。
甚至根據《Fortune》報導,AI模仿人聲的技術與工具變得相當普遍,例如OpenAI旗下就有一款生成式AI軟體「Jukebox」,提供多位知名歌手的樣板歌聲,讓用戶套入由軟體自動生成的詞曲進行創作。任何人都能以低廉、零技術門檻的方式,逼真複製歌手的聲音。Jonathan Coote律師在接受《Fortune》採訪時指出,創作者不可能針對特定曲風去聲請著作權保護。AI 生成的歌曲必須直接包含該歌手過往歌曲的片段、旋律、和弦及歌詞,達到極為實質相似,才能被法院判定是「抄襲」侵權,否則只是調性、歌聲或風格相似而已,並不犯法。
換句話說,關於AI聲音的事情,可能都無法從現行著作權法的角度去切入適用與解決爭議。但或許我們可從數位轉型的維度去看待這件事。
(二)轉型與升降思維
西洋流行歌手Grimes就曾推文表示:「請隨意使用我的聲音,不用怕被告。」鼓勵歌迷使用AI生成模仿Grimes聲音的自創歌曲。且任何成功發行的AI歌曲,Grimes都會分得50%的版稅。甚至Grimes更積極自主發布一套新工具讓任何人可將任何自創歌曲套入,變成Grimes的聲音。
有論者如Yung Spielburg就在他《The music AI attribution problem》文章裡認為,如果作品在不受限制的發行下(例如盜版混音、TikTok短片),可增加音樂原作的曝光度,最終仍有利於原作者的品牌,不僅可保持其知名度,也可推動音樂消費、門票銷售、商品、贊助與其他收入來源。音樂產業的價值現在在於原作者、歌手、藝人品牌而不是音樂資產本身,因此需要在競爭激烈的環境中對內容採取更寬鬆的方式。這是一個雙贏的局面:未經許可的衍生作品的創作者建立他們的追隨者,而原創者則獲得後續的興趣,及如果他們願意的話,能夠適當地將衍生作品商業化。當然,這個商業模式結構與生態環境系統仍依賴於一個前提關鍵,就是創意歸屬,或識別原作與作者的能力。筆者我想到的例子是台灣網紅聖結石曾翻唱周杰倫的某首歌曲,年輕一代的朋友還以為那首歌是聖結石的歌。這就是今後在數位轉型,及思維升降的重點。
其實AI學習聲音方面,反而不是音樂或其他著作形式,而是聲紋或音頻。至於學人家的聲音例如號稱AI孫燕姿,對外已經表示就不是孫燕姿本人的真正聲音了,也沒有假冒本人或侵犯人格權問題。說實在的,AI孫燕姿的出聲不僅讓我們這輩懷念,更讓年輕一輩知道、注意甚至愛上她本人,可能也帶動舊曲故人的新商機,何嘗不是一件好事?
(三)若從今後在人格權的保護角度來看
前面提到了「人格權」,其實更需要進一步討論的是:聲音有聲紋,是否等同於生物辨識,屬於人格權的一種而需要保護?筆者剛剛說AI聲音目前沒有侵害人格權,但不代表未來可能不會侵犯。要知道的是,所謂的肖像權,也沒有在我國民法明文規範中,而是透過實務與判例的累積,才形成一種被承認的具體人格權態樣。
資料數據可以多種型態呈現,例如照片、影片、文字或語音等。AIoT的運作就是透過設備蒐集、分析、運算並存取使用者的個人資料或數據,包括使用者的聲紋、臉部影像、網路使用行為紀錄等資料。 但在蒐集個人資料的過程是否能預見並告知(聲明)其利用態樣、特定目的,而使消費者知情並同意;消費者同意的內容或品質是否具有效性,恐怕隨著AI運用場景、科技與商業模式的不斷改變、演進與擴展,都存有變數與挑戰。
語音數據包括聲紋,其是否為個人資料應受到保護?就必須先釐清聲紋是否為一種「生物特徵」。「生物特徵」是個人特有的生理或行為特徵,其中生理特徵包含指紋、虹膜、面容、聲紋、DNA等,由於生物特徵通常具有獨特、不易改變的特性,因此向來被廣泛用於個人辨識系統。根據歐盟一般資料保護法(GDPR)的規定,認為「聲紋」若被認定為生物特徵資料,則GDPR認定其屬於特種資料,在蒐集、處理與利用上則有更嚴謹的規範。
美國加州隱私權法(CPRA)與加州消費者隱私法(CCPA)同樣在個資定義上均不包括「公開可得之資料」、「經去識別化(deidentified)之資料」,但CPRA增加「敏感性個資」(sensitive personal information)的定義,其中就包括「為獨特性地識別特定消費者的生物特徵資料蒐集與利用」,這也就是「聲紋」所涵蓋的範圍。
我們也可回到台灣的個資法來做基本面的省思。依照我國個資法第2條、其施行細則第3至6條等規定,分別採用列示、補充規定的方式說明個資的範圍。屬於個人資料的列示規定:姓名、出生年月日、國民身分證統一編號、護照號碼、特徵、指紋等。個資補充規定:其他得以直接或間接方式識別個人的資料。所謂「得以間接方式識別」,是指保有該資料之公務或非公務機關僅以該資料不能直接識別,須與其他資料對照、組合、連結等,始能識別該特定之個人。從上所述,不論是個資列示的「特徵」,或「其他得以直接或間接方式識別個人的資料」,都能包含「聲紋」,也就是聲紋就是個人資料。
假以時日,在數位人格權的觀念與法制逐漸成熟,及累績相當的立法例之下,例如個人的聲音或聲紋等資料是否會被納入「聲音權」的保護,可能值得我們持續關注,如同隨著時代演進,像性自主的保護或deepfake深偽這些情況,在法律概念與演進上都從物理、心理,發展到線上或虛擬世界了,我認為聲音的保護可能也會像肖像一樣,變成人格權保護的一種類型。
結論
就AI音樂與聲音所引發的爭議而言,短期內能確定的是,不要侵害到原本作品的著作權、影響本人的肖像權、人格權或名聲、形象,倒是還好。簡單說,除著作權的問題外,就是類似DeepFake那樣(GAN),不要冒用、讓人誤會或侵犯到他人。但長期來說,就是著作權制度、商業模式、生態環境,甚至是數位人格權的演進了。