什麼是「Voice Cloning」? AI擬聲的影響與爭議

raw-image

OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音(Synthetic Voices),並將之用於各種場合。AI擬聲技術所帶來的正面影響顯而易見,但爭議也確實不少。


聲音永流傳

AI擬聲技術的正面影響不少,日前音樂製作人包小柏也分享利用已過世愛女的三句語音訊息,修復訓練出仿真的AI聲音,為他與妻子帶來心裡上的撫慰。其實在娛樂產業中,除了逝世演員能夠因為這項技術而得以「重生」或是「永流傳」。另外不管是AI生成的音樂作品模仿了已故流行天王麥可傑克森(Michael Jackson)的聲音和演唱風格,或是之前引發軒然大波的AI孫燕姿,都是使用AI擬聲技術,有些粉絲樂於見到創新和重現,然而也有粉絲對於這樣的作法也感到擔憂。


隱私與安全

「媽媽!我被綁架了!」電話中那頭的聲音傳來,在突然和焦急的情況下,就算只有三分像,也瞬間覺得一定就是本人。原本在這項技術普及之前,長輩就是電話詐騙常瞄準的破口,現在隨著這項技術的普及,只怕受害對象更會擴張到更年輕的家人和親友。日前更有短影音展示,目前大陸已有許多直播帶貨的主播,本身就是AI生成的虛擬人,能24小時開播不用休息。隨著DeepFake的技術發展,除了之前小玉換頭事件的違法行為,聲音和影像通過AI技術生成違法內容或假新聞,相關的倫理和法律問題也隨之浮,更進一步為社會帶來了更多的風險。不法分子可以輕易複製任何人的聲音,用於詐騙,甚至是誤導,這對個人隱私和安全構成了很大的威脅。詐騙集團可以透過蒐集公開演講或社交媒體上的語音樣本,簡單而快速的創建目標人物的語音模型,進行假冒電話的詐騙行為。

raw-image


智慧財產權

AI擬聲技術對於智慧財產權的影響也不容忽視。如同前面提到的AI孫燕姿的案例,配音員和歌手的聲音象徵個人特色,也是個人財產的一部分,未經授權使用他們的聲音可能會引起版權爭議。進一步來說,創作者本身對於每一次的作品創作,都會有自己的品質要求和藝術表現的想法,如果未經他人同意就使用AI技術複製一個人的聲音進行商業用途,除了對藝術家的個人品牌和形象造成影響,引發法律糾紛,更是剝奪藝術家對於自己作品產出的自由,以及傷害。試想看看,如果一個名人或政治人物,他的聲音在沒有被授權的狀況下,被利用於違反他個人形象的聲音訊息,這個聲音訊息散播出去後,後果難以想像。更可怕的,是這些內容非常有可能是在受害者沒有意識到的情況下,就被大量製造和披露,真可謂無妄之災。


法律與倫理

面對爭議,積極的立法和監管就顯得非常重要了。事實上,歐盟已於2024年3月13日通過全球第一個AI法案(Artificial Intelligence Act),將規範如ChatGPT之類的AI系統。此外,YouTube在其官方部落格更發布消息,表示他們將要求使用生成式 AI工具的創作者必須在他們影片中標明這些內容是合成的。在AI擬聲技術方面,這不外乎就是著眼於嚴格限制未經授權使用他人聲音的行為,並要求透明度和責任機制的建立。為了避免濫用,也必須制定明確的法律來規範定義AI擬聲技術的適當使用範圍。


AI擬聲技術帶來了許多便利和創新機會,但也伴隨著一系列的倫理和法律問題。在享受這項技術帶來的好處的同時,我們也應該積極面對和解決這些問題,確保技術發展與社會道德和法律規範相協調。透過制定合理的政策和規範,我們可以保護個人隱私和知識產權,防止技術濫用,並促進AI擬聲技術的發展。就個人方面,我們也可以利用這項技術來達成自己的目標。想擁有自己的聲音代理人?想要用個人化的聲音朗讀有聲書?網際智慧提供AI聲優配音與有聲書製作的服務,幫助你達成聲音創造的夢想!

raw-image



留言
avatar-img
留言分享你的想法!
avatar-img
GPT工作術|與你一起補給工作的AI能量沙龍
69會員
106內容數
介紹AI趨勢、應用工具,為您補給滿滿の AI超能力!
2024/09/01
最近因為西遊記改編遊戲「黑神話 悟空」熱賣,所以相關討論很多,但如果想用有聲書方式輕鬆複習一下西遊記原著小說,查詢後發現網路上以大陸的口音居多數的有聲內容,口音或許可能聽不習慣。利用AI將西遊記106回的內容改寫成口語化版本,並配上適合傳統文學的聲音,讓聽者能輕鬆理解。 過去出版社製作
Thumbnail
2024/09/01
最近因為西遊記改編遊戲「黑神話 悟空」熱賣,所以相關討論很多,但如果想用有聲書方式輕鬆複習一下西遊記原著小說,查詢後發現網路上以大陸的口音居多數的有聲內容,口音或許可能聽不習慣。利用AI將西遊記106回的內容改寫成口語化版本,並配上適合傳統文學的聲音,讓聽者能輕鬆理解。 過去出版社製作
Thumbnail
2024/08/02
傅達仁先生,被譽為「台灣體育播報界的祖師爺」,以富有激情和感染力的播報風格受到觀眾的喜愛。 無論是激動人心的得分瞬間,還是令人遺憾的失誤,傅達仁都能恰如其分地表達出來。他的聲音彷彿有種魔力,能將賽場上的緊張氣氛和運動員的情感完美傳遞給電視機前的觀眾,讓人不自覺地投入到比賽中,體會到體育競技的精彩魅
Thumbnail
2024/08/02
傅達仁先生,被譽為「台灣體育播報界的祖師爺」,以富有激情和感染力的播報風格受到觀眾的喜愛。 無論是激動人心的得分瞬間,還是令人遺憾的失誤,傅達仁都能恰如其分地表達出來。他的聲音彷彿有種魔力,能將賽場上的緊張氣氛和運動員的情感完美傳遞給電視機前的觀眾,讓人不自覺地投入到比賽中,體會到體育競技的精彩魅
Thumbnail
2024/08/01
你有沒有發現現在我們周圍到處都是 AI 的聲音,但怎麼聽起來都怪怪的?沒錯,那些 AI 聲音大多都是外國腔,從 YouTube 影片到 TikTok 短影音,滿耳聽到的都是不太對勁的口音,聽起來有些彆扭。 所以呢,網際智慧跳了出來:「我們要來個大改造!」,推出了一個有點酷的計畫...
Thumbnail
2024/08/01
你有沒有發現現在我們周圍到處都是 AI 的聲音,但怎麼聽起來都怪怪的?沒錯,那些 AI 聲音大多都是外國腔,從 YouTube 影片到 TikTok 短影音,滿耳聽到的都是不太對勁的口音,聽起來有些彆扭。 所以呢,網際智慧跳了出來:「我們要來個大改造!」,推出了一個有點酷的計畫...
Thumbnail
看更多
你可能也想看
Thumbnail
話說身為短線交易者,每天要作的事情就是從盤勢觀察、到籌碼流向,再到經過多維度資料數據交叉比對,盤中盯著分K、江波圖和五檔報價,算計著每一分K線的轉折,雖能換來即時驗證判斷的快感與成就,但長期下來,卻也衍生眼睛與肩頸卻成了抹不去的職業病。
Thumbnail
話說身為短線交易者,每天要作的事情就是從盤勢觀察、到籌碼流向,再到經過多維度資料數據交叉比對,盤中盯著分K、江波圖和五檔報價,算計著每一分K線的轉折,雖能換來即時驗證判斷的快感與成就,但長期下來,卻也衍生眼睛與肩頸卻成了抹不去的職業病。
Thumbnail
人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
Thumbnail
人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
Thumbnail
PopPop AI 推出的免費線上音效產生器可以將文字轉換為各種聲音,包括自然、人類、樂器、環境和特殊效果等。支援多種語言,使用者可以輸入中文描述創建音效,並可直接播放聆聽和下載音訊。
Thumbnail
PopPop AI 推出的免費線上音效產生器可以將文字轉換為各種聲音,包括自然、人類、樂器、環境和特殊效果等。支援多種語言,使用者可以輸入中文描述創建音效,並可直接播放聆聽和下載音訊。
Thumbnail
今天我要跟大家聊聊 GPT-SoVITS 的用途及其功能。 這個開源的聲音克隆專案,融合了業內頂尖的語音合成工具——GPT (Generative Pre-trained Transformer)模型,和SoVITS(Speech-to-Video Voice Transformation Sys
Thumbnail
今天我要跟大家聊聊 GPT-SoVITS 的用途及其功能。 這個開源的聲音克隆專案,融合了業內頂尖的語音合成工具——GPT (Generative Pre-trained Transformer)模型,和SoVITS(Speech-to-Video Voice Transformation Sys
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音
Thumbnail
OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音
Thumbnail
合成聲音技術的未來充滿希望,也存在挑戰。OpenAI呼籲社會各界一起加強對這一新興技術的認識,並共同探索如何有效地利用這項技術,同時保護公眾免受潛在的負面影響。
Thumbnail
合成聲音技術的未來充滿希望,也存在挑戰。OpenAI呼籲社會各界一起加強對這一新興技術的認識,並共同探索如何有效地利用這項技術,同時保護公眾免受潛在的負面影響。
Thumbnail
Character.AI發佈新功能Character Voice,nVidia在GTC 2024也介紹與Ubisoft巴黎工作室合作的NEO NPC專案,OpenAI註冊了「voice engine」和「digital voice assistants」這兩商標,到底暗示了什麼AI發展趨勢?
Thumbnail
Character.AI發佈新功能Character Voice,nVidia在GTC 2024也介紹與Ubisoft巴黎工作室合作的NEO NPC專案,OpenAI註冊了「voice engine」和「digital voice assistants」這兩商標,到底暗示了什麼AI發展趨勢?
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News