二、AI聲音的法律爭議
(一)現行法律制度
至於我先前有看到人說「學人家的聲音(風格或唱腔)不犯法,但AI在學習聲音時會重製人家音樂,可能觸犯著作權法」,是這樣嗎?前者我認同,但後段我保留。首先要釐清的是,音樂歸音樂、聲音歸聲音,音樂是著作,但聲音是風格、特色,甚至是生物特徵,二者唯一的交集,就是AI在生成音樂與聲音的過程,有沒有copy到歌手本人或音樂著作權人的數位資料與檔案。
因為如果只學某一個人的聲音,就AI技術而言是非常簡單,大概只要擷取那個人每首歌的一丁點片段音頻/聲紋即可,那就每一首歌而言,被擷取的質量恐怕也很難構成copy,就算未經同意的重製,應該也符合「合理使用」原則,而難謂侵害著作權。
甚至根據《Fortune》報導,AI模仿人聲的技術與工具變得相當普遍,例如OpenAI旗下就有一款生成式AI軟體「Jukebox」,提供多位知名歌手的樣板歌聲,讓用戶套入由軟體自動生成的詞曲進行創作。任何人都能以低廉、零技術門檻的方式,逼真複製歌手的聲音。Jonathan Coote律師在接受《Fortune》採訪時指出,創作者不可能針對特定曲風去聲請著作權保護。AI 生成的歌曲必須直接包含該歌手過往歌曲的片段、旋律、和弦及歌詞,達到極為實質相似,才能被法院判定是「抄襲」侵權,否則只是調性、歌聲或風格相似而已,並不犯法。
換句話說,關於AI聲音的事情,可能都無法從現行著作權法的角度去切入適用與解決爭議。但或許我們可從數位轉型的維度去看待這件事。
(二)轉型與升降思維
西洋流行歌手Grimes就曾推文表示:「請隨意使用我的聲音,不用怕被告。」鼓勵歌迷使用AI生成模仿Grimes聲音的自創歌曲。且任何成功發行的AI歌曲,Grimes都會分得50%的版稅。甚至Grimes更積極自主發布一套新工具讓任何人可將任何自創歌曲套入,變成Grimes的聲音。
有論者如Yung Spielburg就在他《The music AI attribution problem》文章裡認為,如果作品在不受限制的發行下(例如盜版混音、TikTok短片),可增加音樂原作的曝光度,最終仍有利於原作者的品牌,不僅可保持其知名度,也可推動音樂消費、門票銷售、商品、贊助與其他收入來源。音樂產業的價值現在在於原作者、歌手、藝人品牌而不是音樂資產本身,因此需要在競爭激烈的環境中對內容採取更寬鬆的方式。這是一個雙贏的局面:未經許可的衍生作品的創作者建立他們的追隨者,而原創者則獲得後續的興趣,及如果他們願意的話,能夠適當地將衍生作品商業化。當然,這個商業模式結構與生態環境系統仍依賴於一個前提關鍵,就是創意歸屬,或識別原作與作者的能力。筆者我想到的例子是台灣網紅聖結石曾翻唱周杰倫的某首歌曲,年輕一代的朋友還以為那首歌是聖結石的歌。這就是今後在數位轉型,及思維升降的重點。
其實AI學習聲音方面,反而不是音樂或其他著作形式,而是聲紋或音頻。至於學人家的聲音例如號稱AI孫燕姿,對外已經表示就不是孫燕姿本人的真正聲音了,也沒有假冒本人或侵犯人格權問題。說實在的,AI孫燕姿的出聲不僅讓我們這輩懷念,更讓年輕一輩知道、注意甚至愛上她本人,可能也帶動舊曲故人的新商機,何嘗不是一件好事?
(三)若從今後在人格權的保護角度來看
前面提到了「人格權」,其實更需要進一步討論的是:聲音有聲紋,是否等同於生物辨識,屬於人格權的一種而需要保護?筆者剛剛說AI聲音目前沒有侵害人格權,但不代表未來可能不會侵犯。要知道的是,所謂的肖像權,也沒有在我國民法明文規範中,而是透過實務與判例的累積,才形成一種被承認的具體人格權態樣。
資料數據可以多種型態呈現,例如照片、影片、文字或語音等。AIoT的運作就是透過設備蒐集、分析、運算並存取使用者的個人資料或數據,包括使用者的聲紋、臉部影像、網路使用行為紀錄等資料。 但在蒐集個人資料的過程是否能預見並告知(聲明)其利用態樣、特定目的,而使消費者知情並同意;消費者同意的內容或品質是否具有效性,恐怕隨著AI運用場景、科技與商業模式的不斷改變、演進與擴展,都存有變數與挑戰。
語音數據包括聲紋,其是否為個人資料應受到保護?就必須先釐清聲紋是否為一種「生物特徵」。「生物特徵」是個人特有的生理或行為特徵,其中生理特徵包含指紋、虹膜、面容、聲紋、DNA等,由於生物特徵通常具有獨特、不易改變的特性,因此向來被廣泛用於個人辨識系統。根據歐盟一般資料保護法(GDPR)的規定,認為「聲紋」若被認定為生物特徵資料,則GDPR認定其屬於特種資料,在蒐集、處理與利用上則有更嚴謹的規範。
美國加州隱私權法(CPRA)與加州消費者隱私法(CCPA)同樣在個資定義上均不包括「公開可得之資料」、「經去識別化(deidentified)之資料」,但CPRA增加「敏感性個資」(sensitive personal information)的定義,其中就包括「為獨特性地識別特定消費者的生物特徵資料蒐集與利用」,這也就是「聲紋」所涵蓋的範圍。
我們也可回到台灣的個資法來做基本面的省思。依照我國個資法第2條、其施行細則第3至6條等規定,分別採用列示、補充規定的方式說明個資的範圍。屬於個人資料的列示規定:姓名、出生年月日、國民身分證統一編號、護照號碼、特徵、指紋等。個資補充規定:其他得以直接或間接方式識別個人的資料。所謂「得以間接方式識別」,是指保有該資料之公務或非公務機關僅以該資料不能直接識別,須與其他資料對照、組合、連結等,始能識別該特定之個人。從上所述,不論是個資列示的「特徵」,或「其他得以直接或間接方式識別個人的資料」,都能包含「聲紋」,也就是聲紋就是個人資料。
假以時日,在數位人格權的觀念與法制逐漸成熟,及累績相當的立法例之下,例如個人的聲音或聲紋等資料是否會被納入「聲音權」的保護,可能值得我們持續關注,如同隨著時代演進,像性自主的保護或deepfake深偽這些情況,在法律概念與演進上都從物理、心理,發展到線上或虛擬世界了,我認為聲音的保護可能也會像肖像一樣,變成人格權保護的一種類型。
結論
就AI音樂與聲音所引發的爭議而言,短期內能確定的是,不要侵害到原本作品的著作權、影響本人的肖像權、人格權或名聲、形象,倒是還好。簡單說,除著作權的問題外,就是類似DeepFake那樣(GAN),不要冒用、讓人誤會或侵犯到他人。但長期來說,就是著作權制度、商業模式、生態環境,甚至是數位人格權的演進了。