OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音(Synthetic Voices),並將之用於各種場合。AI擬聲技術所帶來的正面影響顯而易見,但爭議也確實不少。
聲音永流傳
AI擬聲技術的正面影響不少,日前音樂製作人包小柏也分享利用已過世愛女的三句語音訊息,修復訓練出仿真的AI聲音,為他與妻子帶來心裡上的撫慰。其實在娛樂產業中,除了逝世演員能夠因為這項技術而得以「重生」或是「永流傳」。另外不管是AI生成的音樂作品模仿了已故流行天王麥可傑克森(Michael Jackson)的聲音和演唱風格,或是之前引發軒然大波的AI孫燕姿,都是使用AI擬聲技術,有些粉絲樂於見到創新和重現,然而也有粉絲對於這樣的作法也感到擔憂。
隱私與安全
「媽媽!我被綁架了!」電話中那頭的聲音傳來,在突然和焦急的情況下,就算只有三分像,也瞬間覺得一定就是本人。原本在這項技術普及之前,長輩就是電話詐騙常瞄準的破口,現在隨著這項技術的普及,只怕受害對象更會擴張到更年輕的家人和親友。日前更有短影音展示,目前大陸已有許多直播帶貨的主播,本身就是AI生成的虛擬人,能24小時開播不用休息。隨著DeepFake的技術發展,除了之前小玉換頭事件的違法行為,聲音和影像通過AI技術生成違法內容或假新聞,相關的倫理和法律問題也隨之浮,更進一步為社會帶來了更多的風險。不法分子可以輕易複製任何人的聲音,用於詐騙,甚至是誤導,這對個人隱私和安全構成了很大的威脅。詐騙集團可以透過蒐集公開演講或社交媒體上的語音樣本,簡單而快速的創建目標人物的語音模型,進行假冒電話的詐騙行為。
智慧財產權
AI擬聲技術對於智慧財產權的影響也不容忽視。如同前面提到的AI孫燕姿的案例,配音員和歌手的聲音象徵個人特色,也是個人財產的一部分,未經授權使用他們的聲音可能會引起版權爭議。進一步來說,創作者本身對於每一次的作品創作,都會有自己的品質要求和藝術表現的想法,如果未經他人同意就使用AI技術複製一個人的聲音進行商業用途,除了對藝術家的個人品牌和形象造成影響,引發法律糾紛,更是剝奪藝術家對於自己作品產出的自由,以及傷害。試想看看,如果一個名人或政治人物,他的聲音在沒有被授權的狀況下,被利用於違反他個人形象的聲音訊息,這個聲音訊息散播出去後,後果難以想像。更可怕的,是這些內容非常有可能是在受害者沒有意識到的情況下,就被大量製造和披露,真可謂無妄之災。
法律與倫理
面對爭議,積極的立法和監管就顯得非常重要了。事實上,歐盟已於2024年3月13日通過全球第一個AI法案(Artificial Intelligence Act),將規範如ChatGPT之類的AI系統。此外,YouTube在其官方部落格更發布消息,表示他們將要求使用生成式 AI工具的創作者必須在他們影片中標明這些內容是合成的。在AI擬聲技術方面,這不外乎就是著眼於嚴格限制未經授權使用他人聲音的行為,並要求透明度和責任機制的建立。為了避免濫用,也必須制定明確的法律來規範定義AI擬聲技術的適當使用範圍。
AI擬聲技術帶來了許多便利和創新機會,但也伴隨著一系列的倫理和法律問題。在享受這項技術帶來的好處的同時,我們也應該積極面對和解決這些問題,確保技術發展與社會道德和法律規範相協調。透過制定合理的政策和規範,我們可以保護個人隱私和知識產權,防止技術濫用,並促進AI擬聲技術的發展。就個人方面,我們也可以利用這項技術來達成自己的目標。想擁有自己的聲音代理人?想要用個人化的聲音朗讀有聲書?網際智慧提供AI聲優配音與有聲書製作的服務,幫助你達成聲音創造的夢想!