什麼是「Voice Cloning」？ AI擬聲的影響與爭議

更新於 2024/04/08發佈於 2024/04/08閱讀時間約 4 分鐘

OpenAI近期公開了名為「Voice Engine（語音引擎）」的AI模型，使用者只要輸入文字與15秒的音訊樣本，該模型便會自動生成與原說話者相似的語音訊息。AI擬聲，也就是大家常說的聲音克隆（Voice Cloning），這項技術發展迅速，讓我們可以輕易複製一個人的聲音，產生合成語音（Synthetic Voices），並將之用於各種場合。AI擬聲技術所帶來的正面影響顯而易見，但爭議也確實不少。

聲音永流傳

AI擬聲技術的正面影響不少，日前音樂製作人包小柏也分享利用已過世愛女的三句語音訊息，修復訓練出仿真的AI聲音，為他與妻子帶來心裡上的撫慰。其實在娛樂產業中，除了逝世演員能夠因為這項技術而得以「重生」或是「永流傳」。另外不管是AI生成的音樂作品模仿了已故流行天王麥可傑克森（Michael Jackson）的聲音和演唱風格，或是之前引發軒然大波的AI孫燕姿，都是使用AI擬聲技術，有些粉絲樂於見到創新和重現，然而也有粉絲對於這樣的作法也感到擔憂。

隱私與安全

「媽媽！我被綁架了！」電話中那頭的聲音傳來，在突然和焦急的情況下，就算只有三分像，也瞬間覺得一定就是本人。原本在這項技術普及之前，長輩就是電話詐騙常瞄準的破口，現在隨著這項技術的普及，只怕受害對象更會擴張到更年輕的家人和親友。日前更有短影音展示，目前大陸已有許多直播帶貨的主播，本身就是AI生成的虛擬人，能24小時開播不用休息。隨著DeepFake的技術發展，除了之前小玉換頭事件的違法行為，聲音和影像通過AI技術生成違法內容或假新聞，相關的倫理和法律問題也隨之浮，更進一步為社會帶來了更多的風險。不法分子可以輕易複製任何人的聲音，用於詐騙，甚至是誤導，這對個人隱私和安全構成了很大的威脅。詐騙集團可以透過蒐集公開演講或社交媒體上的語音樣本，簡單而快速的創建目標人物的語音模型，進行假冒電話的詐騙行為。

智慧財產權

AI擬聲技術對於智慧財產權的影響也不容忽視。如同前面提到的AI孫燕姿的案例，配音員和歌手的聲音象徵個人特色，也是個人財產的一部分，未經授權使用他們的聲音可能會引起版權爭議。進一步來說，創作者本身對於每一次的作品創作，都會有自己的品質要求和藝術表現的想法，如果未經他人同意就使用AI技術複製一個人的聲音進行商業用途，除了對藝術家的個人品牌和形象造成影響，引發法律糾紛，更是剝奪藝術家對於自己作品產出的自由，以及傷害。試想看看，如果一個名人或政治人物，他的聲音在沒有被授權的狀況下，被利用於違反他個人形象的聲音訊息，這個聲音訊息散播出去後，後果難以想像。更可怕的，是這些內容非常有可能是在受害者沒有意識到的情況下，就被大量製造和披露，真可謂無妄之災。

法律與倫理

面對爭議，積極的立法和監管就顯得非常重要了。事實上，歐盟已於2024年3月13日通過全球第一個AI法案（Artificial Intelligence Act），將規範如ChatGPT之類的AI系統。此外，YouTube在其官方部落格更發布消息，表示他們將要求使用生成式 AI工具的創作者必須在他們影片中標明這些內容是合成的。在AI擬聲技術方面，這不外乎就是著眼於嚴格限制未經授權使用他人聲音的行為，並要求透明度和責任機制的建立。為了避免濫用，也必須制定明確的法律來規範定義AI擬聲技術的適當使用範圍。

AI擬聲技術帶來了許多便利和創新機會，但也伴隨著一系列的倫理和法律問題。在享受這項技術帶來的好處的同時，我們也應該積極面對和解決這些問題，確保技術發展與社會道德和法律規範相協調。透過制定合理的政策和規範，我們可以保護個人隱私和知識產權，防止技術濫用，並促進AI擬聲技術的發展。就個人方面，我們也可以利用這項技術來達成自己的目標。想擁有自己的聲音代理人？想要用個人化的聲音朗讀有聲書？網際智慧提供AI聲優配音與有聲書製作的服務，幫助你達成聲音創造的夢想！