什麼是「Voice Cloning」? AI擬聲的影響與爭議

閱讀時間約 4 分鐘
raw-image

OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音(Synthetic Voices),並將之用於各種場合。AI擬聲技術所帶來的正面影響顯而易見,但爭議也確實不少。


聲音永流傳

AI擬聲技術的正面影響不少,日前音樂製作人包小柏也分享利用已過世愛女的三句語音訊息,修復訓練出仿真的AI聲音,為他與妻子帶來心裡上的撫慰。其實在娛樂產業中,除了逝世演員能夠因為這項技術而得以「重生」或是「永流傳」。另外不管是AI生成的音樂作品模仿了已故流行天王麥可傑克森(Michael Jackson)的聲音和演唱風格,或是之前引發軒然大波的AI孫燕姿,都是使用AI擬聲技術,有些粉絲樂於見到創新和重現,然而也有粉絲對於這樣的作法也感到擔憂。


隱私與安全

「媽媽!我被綁架了!」電話中那頭的聲音傳來,在突然和焦急的情況下,就算只有三分像,也瞬間覺得一定就是本人。原本在這項技術普及之前,長輩就是電話詐騙常瞄準的破口,現在隨著這項技術的普及,只怕受害對象更會擴張到更年輕的家人和親友。日前更有短影音展示,目前大陸已有許多直播帶貨的主播,本身就是AI生成的虛擬人,能24小時開播不用休息。隨著DeepFake的技術發展,除了之前小玉換頭事件的違法行為,聲音和影像通過AI技術生成違法內容或假新聞,相關的倫理和法律問題也隨之浮,更進一步為社會帶來了更多的風險。不法分子可以輕易複製任何人的聲音,用於詐騙,甚至是誤導,這對個人隱私和安全構成了很大的威脅。詐騙集團可以透過蒐集公開演講或社交媒體上的語音樣本,簡單而快速的創建目標人物的語音模型,進行假冒電話的詐騙行為。

raw-image


智慧財產權

AI擬聲技術對於智慧財產權的影響也不容忽視。如同前面提到的AI孫燕姿的案例,配音員和歌手的聲音象徵個人特色,也是個人財產的一部分,未經授權使用他們的聲音可能會引起版權爭議。進一步來說,創作者本身對於每一次的作品創作,都會有自己的品質要求和藝術表現的想法,如果未經他人同意就使用AI技術複製一個人的聲音進行商業用途,除了對藝術家的個人品牌和形象造成影響,引發法律糾紛,更是剝奪藝術家對於自己作品產出的自由,以及傷害。試想看看,如果一個名人或政治人物,他的聲音在沒有被授權的狀況下,被利用於違反他個人形象的聲音訊息,這個聲音訊息散播出去後,後果難以想像。更可怕的,是這些內容非常有可能是在受害者沒有意識到的情況下,就被大量製造和披露,真可謂無妄之災。


法律與倫理

面對爭議,積極的立法和監管就顯得非常重要了。事實上,歐盟已於2024年3月13日通過全球第一個AI法案(Artificial Intelligence Act),將規範如ChatGPT之類的AI系統。此外,YouTube在其官方部落格更發布消息,表示他們將要求使用生成式 AI工具的創作者必須在他們影片中標明這些內容是合成的。在AI擬聲技術方面,這不外乎就是著眼於嚴格限制未經授權使用他人聲音的行為,並要求透明度和責任機制的建立。為了避免濫用,也必須制定明確的法律來規範定義AI擬聲技術的適當使用範圍。


AI擬聲技術帶來了許多便利和創新機會,但也伴隨著一系列的倫理和法律問題。在享受這項技術帶來的好處的同時,我們也應該積極面對和解決這些問題,確保技術發展與社會道德和法律規範相協調。透過制定合理的政策和規範,我們可以保護個人隱私和知識產權,防止技術濫用,並促進AI擬聲技術的發展。就個人方面,我們也可以利用這項技術來達成自己的目標。想擁有自己的聲音代理人?想要用個人化的聲音朗讀有聲書?網際智慧提供AI聲優配音與有聲書製作的服務,幫助你達成聲音創造的夢想!

raw-image



介紹AI趨勢、應用工具,為您補給滿滿の AI超能力!
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
既然健康食品可以宣稱自己的功效,那我是不是申請小綠人標章就好了?申請難不難?要怎麼申請?這次我們就來介紹如何成為「健康食品」,以及如何拿到認證。  根據「健康食品管理法」規定,若要想申請成為健康食品,採雙軌制進行查核。
相信大家前幾周以來一定都被『蘇丹紅』瘋狂洗板,是不是連外出用餐都會擔心有沒有接觸到的風險。但不知道在新聞報導、各專家解說和網路文章之後,大家是不是真的清楚什麼是蘇丹紅?為什麼要加在食品?吃了到底對我有什麼危害?今天就進一步跟各位分享一下食品添加劑。 
寶林茶室發送疑似食品中毒事件,截至28日上午,已有兩位患者不幸身亡,累計14人中毒。衛福部長薛瑞元接受採訪時指出,食物中毒可能性有3大類,第1是微生物引起,例如常見的諾羅病毒;第2大類是內生性的毒素;第3則是外面加進來的毒素。目前專家認為,此案不偏向微生物引起,現在是往後兩者做討論。
Character.AI發佈新功能Character Voice,nVidia在GTC 2024也介紹與Ubisoft巴黎工作室合作的NEO NPC專案,OpenAI註冊了「voice engine」和「digital voice assistants」這兩商標,到底暗示了什麼AI發展趨勢?
『健康食品』為法定名詞,『自「健康食品管理法」實行以來,需向衛生福利部申請查驗登記許可,才可以稱為「健康食品」。並且依據健康食品管理法之定義,「健康食品」係為具有實質科學證據之「保健功效」,並標示或廣告具該功效,非屬治療、矯正人類疾病之醫療效能為目的之食品』。
文字MP3專業版是簡單且強大的工具,會編輯文字就能創造出專業級配音。簡單 ﹑容易上手,像使用Word,無需剪輯經驗,輕鬆完成調整語速﹑插入空秒﹑插入背景音樂或音效等方面的製作。提供多種語言和配音員選擇,包括純正的臺灣口音。這個工具能應用於各種情境,如教育訓練簡報、有聲書、Podcast等。
既然健康食品可以宣稱自己的功效,那我是不是申請小綠人標章就好了?申請難不難?要怎麼申請?這次我們就來介紹如何成為「健康食品」,以及如何拿到認證。  根據「健康食品管理法」規定,若要想申請成為健康食品,採雙軌制進行查核。
相信大家前幾周以來一定都被『蘇丹紅』瘋狂洗板,是不是連外出用餐都會擔心有沒有接觸到的風險。但不知道在新聞報導、各專家解說和網路文章之後,大家是不是真的清楚什麼是蘇丹紅?為什麼要加在食品?吃了到底對我有什麼危害?今天就進一步跟各位分享一下食品添加劑。 
寶林茶室發送疑似食品中毒事件,截至28日上午,已有兩位患者不幸身亡,累計14人中毒。衛福部長薛瑞元接受採訪時指出,食物中毒可能性有3大類,第1是微生物引起,例如常見的諾羅病毒;第2大類是內生性的毒素;第3則是外面加進來的毒素。目前專家認為,此案不偏向微生物引起,現在是往後兩者做討論。
Character.AI發佈新功能Character Voice,nVidia在GTC 2024也介紹與Ubisoft巴黎工作室合作的NEO NPC專案,OpenAI註冊了「voice engine」和「digital voice assistants」這兩商標,到底暗示了什麼AI發展趨勢?
『健康食品』為法定名詞,『自「健康食品管理法」實行以來,需向衛生福利部申請查驗登記許可,才可以稱為「健康食品」。並且依據健康食品管理法之定義,「健康食品」係為具有實質科學證據之「保健功效」,並標示或廣告具該功效,非屬治療、矯正人類疾病之醫療效能為目的之食品』。
文字MP3專業版是簡單且強大的工具,會編輯文字就能創造出專業級配音。簡單 ﹑容易上手,像使用Word,無需剪輯經驗,輕鬆完成調整語速﹑插入空秒﹑插入背景音樂或音效等方面的製作。提供多種語言和配音員選擇,包括純正的臺灣口音。這個工具能應用於各種情境,如教育訓練簡報、有聲書、Podcast等。
你可能也想看
Google News 追蹤
Thumbnail
人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
Thumbnail
PopPop AI 推出的免費線上音效產生器可以將文字轉換為各種聲音,包括自然、人類、樂器、環境和特殊效果等。支援多種語言,使用者可以輸入中文描述創建音效,並可直接播放聆聽和下載音訊。
Thumbnail
今天我要跟大家聊聊 GPT-SoVITS 的用途及其功能。 這個開源的聲音克隆專案,融合了業內頂尖的語音合成工具——GPT (Generative Pre-trained Transformer)模型,和SoVITS(Speech-to-Video Voice Transformation Sys
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
據我所知,許多配音員老師是很反對去錄AI語音採樣的,但我則是抱持著不同的想法。昨天在九號群裡,和在線的伙伴們聊了一下我的想法,列出了很多應用場景,供大家自我判斷是否適合去錄AI語音採樣。 本篇內容是為剛從聲音培訓班結業、自我訓練一段時間、對聲音表演有興趣,但是不想成為配音員....等非職業配音員的
Thumbnail
合成聲音技術的未來充滿希望,也存在挑戰。OpenAI呼籲社會各界一起加強對這一新興技術的認識,並共同探索如何有效地利用這項技術,同時保護公眾免受潛在的負面影響。
Thumbnail
之前有寫過一篇 《AI工具│透過AI整合的語音功能 Murf》,近期使用過之後,隨著ChatGPT與相關AI普及之後,新的自動生成網站與工具變得多元了起來。 大多會使用在影片製作中,若缺少的素材,或是想要呈現事件及詼諧感的時候,會加入片段人聲去做效果。 於是決定,統整一下自己最近常用的4個AI語
Thumbnail
聲音經濟 (Voice Economy) 是指以聲音為基礎的商業模式、技術與應用,用於創造價值和增加用戶體驗。藉由 AI改變聲音的創作、傳播與消費,將大幅改變人們與科技和品牌互動的方式。本文探討了AI世代包括虛擬語音助理、智慧音箱、文字生成語音和Podcast等不容忽視的市場數據和商業機會。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
Thumbnail
PopPop AI 推出的免費線上音效產生器可以將文字轉換為各種聲音,包括自然、人類、樂器、環境和特殊效果等。支援多種語言,使用者可以輸入中文描述創建音效,並可直接播放聆聽和下載音訊。
Thumbnail
今天我要跟大家聊聊 GPT-SoVITS 的用途及其功能。 這個開源的聲音克隆專案,融合了業內頂尖的語音合成工具——GPT (Generative Pre-trained Transformer)模型,和SoVITS(Speech-to-Video Voice Transformation Sys
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
據我所知,許多配音員老師是很反對去錄AI語音採樣的,但我則是抱持著不同的想法。昨天在九號群裡,和在線的伙伴們聊了一下我的想法,列出了很多應用場景,供大家自我判斷是否適合去錄AI語音採樣。 本篇內容是為剛從聲音培訓班結業、自我訓練一段時間、對聲音表演有興趣,但是不想成為配音員....等非職業配音員的
Thumbnail
合成聲音技術的未來充滿希望,也存在挑戰。OpenAI呼籲社會各界一起加強對這一新興技術的認識,並共同探索如何有效地利用這項技術,同時保護公眾免受潛在的負面影響。
Thumbnail
之前有寫過一篇 《AI工具│透過AI整合的語音功能 Murf》,近期使用過之後,隨著ChatGPT與相關AI普及之後,新的自動生成網站與工具變得多元了起來。 大多會使用在影片製作中,若缺少的素材,或是想要呈現事件及詼諧感的時候,會加入片段人聲去做效果。 於是決定,統整一下自己最近常用的4個AI語
Thumbnail
聲音經濟 (Voice Economy) 是指以聲音為基礎的商業模式、技術與應用,用於創造價值和增加用戶體驗。藉由 AI改變聲音的創作、傳播與消費,將大幅改變人們與科技和品牌互動的方式。本文探討了AI世代包括虛擬語音助理、智慧音箱、文字生成語音和Podcast等不容忽視的市場數據和商業機會。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。