發現薇趨勢/生成式AI時代 需要有人味的聲音

更新 發佈閱讀 3 分鐘

今年年初,OpenAI推出ChatGPT應用程式,正式開啟了全球生成式AI(AI Gernative Content; AIGC)的序幕。

目前表現較出色的,文字生成有ChatGPT和文心一言,圖片生成有Midjourney,影片生成有DeepBrain和Kaiber,聲音生成則有Fliki和LOVO,這些都是科技創新的一大突破。

這項新技術悄悄進入我們的生活與工作場域,許多專欄與新聞開始關注使用者──「人」,未來究竟還有多少工作機會?科技將如何取代人類的工作?

前陣子跟一位公司創辦人聊天,他說公司裡的文字編輯相當抗拒使用ChatGPT,原因是擔心有朝一日被取代。創辦人苦口婆心告訴員工,若是擅長的專業,應當是親自撰寫文章;但碰到不熟悉的領域,生成式AI發揮的效力,也許比「人」還好。因此他鼓勵員工發揮自己的才華之外,也該讓生成式AI提高生產效率。

員工嘴上雖然說好,但產出的作品很明顯的沒有與這位敏捷的「助手」協作。最後,員工遭解雇,創辦人自己用生成式AI輔助,兼職當文字編輯。

生成式AI運用在影片場域,大致有兩種模式:一種是從文本變成影片,近期已有國內電視台使用AI虛擬主播播報新聞;另一種則是由AI讀取文本內容後,從資料庫抓取適合的圖片或影像。

那麼聲音呢?其實坊間有許多AI生成聲音的應用軟體,我也嘗試使用了目前比較流行的幾種。有意思的是,目前支援跨語言生成聲音內容已不成問題,若讀者常使用Youtube和抖音Tiktok,不難發現許多敘述電影故事的影片,搭配了「清新男聲」,就算是不同創作者上傳的影片,聲音也都如出一轍,其實那些都是利用生成式AI合成的聲音。

近期與另一好友聚會,他旗下的企業算是國內AI生成的佼佼者,透過錄音,能訓練語音模型,一旦訓練完成,就能讓專屬你的AI發出你的聲音。

既然聲音可以拷貝,那「人」的價值在哪裡呢?在情緒。

好友說目前他們製作的音檔,比較適合播報新聞或旁白,若要表現情緒,只能放慢語速或增加重音。他們的產品搭配AI生成影像,因此可以透過人的表情,加深聲音表情。

國外某些AI語音模型雖然可以選擇情緒,但假的AI語音跟真人在情感表達與傳遞能力上,確實有落差。

再者,情緒選擇需要批次處理,也就是一個故事如果出現的情緒有十種,不同段落的生成,需要批次處理再剪輯。目前比較受歡迎的幾種AI語音模型,也只有特定幾個聲音能選擇情緒。

在生成式AI席捲全球的同時,備受關注的議題,除了人的價值,就是AI內容產出的所有權與智慧財產權了。

智慧財產權,原則上歸屬於法人或自然人,而AI生成的內容顯然介於模糊地帶。若只是利用AI輔助生成,主要創作者是人,那麼權利自然歸人;但創作者若只是下指令,圖片產出由AI操刀,創作者使用AI究竟屬於輔助創作,還是獨立創作?

用自己的聲音訓練的模型,就算產出了熱呼呼的內容,聲音情緒卻是冷冰冰的,著實乏味;一篇感動五內的故事,變成不帶情緒的新聞播報,未免可惜。在AIGC盛行的年代,有人味的聲音,還是最容易凸顯人的價值。

留言
avatar-img
留言分享你的想法!
avatar-img
王薇瑄的沙龍
25會員
117內容數
Podcast節目【數位趨勢醬子讀】的專欄作家文章匯流 從科技新聞帶你看產業趨勢,有別於坊間搖旗吶喊式的附和,本節目提供的獨家觀點絕對讓你耳目一新! 你想知道科技新聞背後的微趨勢將如何改變我們的未來嗎?跟著兩位專欄名家一起看就世界還沒發現的微趨勢吧!
王薇瑄的沙龍的其他內容
2025/04/29
西班牙近期推出《人工智慧良善使用與治理法》草案,引發社會強烈反彈。該草案延續歐盟AI法規,對企業使用高風險或禁用技術祭出重罰,但對政府部門的違規行為,僅以「警告」與「紀律處分」帶過,形同免責。此種制度設計讓人質疑:當AI成為國家治理工具,誰來監控擁有監控權力的機構?
2025/04/29
西班牙近期推出《人工智慧良善使用與治理法》草案,引發社會強烈反彈。該草案延續歐盟AI法規,對企業使用高風險或禁用技術祭出重罰,但對政府部門的違規行為,僅以「警告」與「紀律處分」帶過,形同免責。此種制度設計讓人質疑:當AI成為國家治理工具,誰來監控擁有監控權力的機構?
2025/04/15
4月初,美國總統川普宣布對多國進口商品加徵新一輪關稅,乍看是選舉年再度上演的經濟民族主義,實則是一次以關稅為槓桿的全球權力重構。這場關稅行動,打著保護本土產業的旗號,卻充滿選擇性與策略性操作,既向選民展示強硬姿態,又保留與盟國談判的籌碼。
2025/04/15
4月初,美國總統川普宣布對多國進口商品加徵新一輪關稅,乍看是選舉年再度上演的經濟民族主義,實則是一次以關稅為槓桿的全球權力重構。這場關稅行動,打著保護本土產業的旗號,卻充滿選擇性與策略性操作,既向選民展示強硬姿態,又保留與盟國談判的籌碼。
2025/04/01
AI正改寫21世紀的產業版圖。中美兩國的人工智慧競爭,不只是技術領先的角力,更是一場制度模型與產業結構的對決。兩國分別在政策驅動與市場機制下走出不同節奏,也映照出背後深層的地緣戰略與價值選擇。
2025/04/01
AI正改寫21世紀的產業版圖。中美兩國的人工智慧競爭,不只是技術領先的角力,更是一場制度模型與產業結構的對決。兩國分別在政策驅動與市場機制下走出不同節奏,也映照出背後深層的地緣戰略與價值選擇。
看更多
你可能也想看
Thumbnail
還在煩惱平凡日常該如何增添一點小驚喜嗎?全家便利商店這次聯手超萌的馬來貘,推出黑白配色的馬來貘雪糕,不僅外觀吸睛,層次豐富的雙層口味更是讓人一口接一口!本文將帶你探索馬來貘雪糕的多種創意吃法,從簡單的豆漿燕麥碗、藍莓果昔,到大人系的奇亞籽布丁下午茶,讓可愛的馬來貘陪你度過每一餐,增添生活中的小確幸!
Thumbnail
還在煩惱平凡日常該如何增添一點小驚喜嗎?全家便利商店這次聯手超萌的馬來貘,推出黑白配色的馬來貘雪糕,不僅外觀吸睛,層次豐富的雙層口味更是讓人一口接一口!本文將帶你探索馬來貘雪糕的多種創意吃法,從簡單的豆漿燕麥碗、藍莓果昔,到大人系的奇亞籽布丁下午茶,讓可愛的馬來貘陪你度過每一餐,增添生活中的小確幸!
Thumbnail
人工智慧生成內容(AIGC)的崛起,AI在文字、圖像、產品文案等方面的應用正掀起波瀾。本文分享了使用ChatGPT進行文案撰寫以及對於咒語格式與最佳內容認知的觀察。不過,使用者的專業程度對合作成果至關重要。另外,文章觸及使用AI工具提供的功能性應用,以及在創作和發展方面的潛力。
Thumbnail
人工智慧生成內容(AIGC)的崛起,AI在文字、圖像、產品文案等方面的應用正掀起波瀾。本文分享了使用ChatGPT進行文案撰寫以及對於咒語格式與最佳內容認知的觀察。不過,使用者的專業程度對合作成果至關重要。另外,文章觸及使用AI工具提供的功能性應用,以及在創作和發展方面的潛力。
Thumbnail
生成式AI,這不僅僅是一個新奇的技術詞彙,它正在全方位地重新塑造我們的日常和商業格局。從你的智能手機到車上的自駕功能,再到商家使用的各式創新工具,AI已經不再陌生。而當我們提到生成式AI應用程序,例如ChatGPT、GitHub Copilot和Stable Diffusion等,它們已經成為了話題
Thumbnail
生成式AI,這不僅僅是一個新奇的技術詞彙,它正在全方位地重新塑造我們的日常和商業格局。從你的智能手機到車上的自駕功能,再到商家使用的各式創新工具,AI已經不再陌生。而當我們提到生成式AI應用程序,例如ChatGPT、GitHub Copilot和Stable Diffusion等,它們已經成為了話題
Thumbnail
文摘:我最近採用了新的寫作方式,利用AI將我錄製的播客內容轉換成文章形式。這個過程需要使用兩套AI程式,分別是雅婷語音轉逐字稿和ChatGPT。以往直接將語音轉換成逐字稿是不實用的,因為缺乏邏輯結構,需要耗費大量時間整理。但現在有了ChatGPT,它可以將逐字稿轉換成有邏輯結構的文章初稿,我再進行修
Thumbnail
文摘:我最近採用了新的寫作方式,利用AI將我錄製的播客內容轉換成文章形式。這個過程需要使用兩套AI程式,分別是雅婷語音轉逐字稿和ChatGPT。以往直接將語音轉換成逐字稿是不實用的,因為缺乏邏輯結構,需要耗費大量時間整理。但現在有了ChatGPT,它可以將逐字稿轉換成有邏輯結構的文章初稿,我再進行修
Thumbnail
你試用過人工智能(AI)文字轉語音功能了嗎? AI語音發展已經可高效地產出仿人聲語音,那麼,朗誦員、配音員的工作量是否會急遽減少呢? 現在爭議的問題點在於:業界人士發現有服務提供者混合市面上數種人聲錄音創造AI音頻,但沒有經過授權同意,侵害到原作者智慧財產權。 本篇文章介紹Google自動朗誦及AI
Thumbnail
你試用過人工智能(AI)文字轉語音功能了嗎? AI語音發展已經可高效地產出仿人聲語音,那麼,朗誦員、配音員的工作量是否會急遽減少呢? 現在爭議的問題點在於:業界人士發現有服務提供者混合市面上數種人聲錄音創造AI音頻,但沒有經過授權同意,侵害到原作者智慧財產權。 本篇文章介紹Google自動朗誦及AI
Thumbnail
「科技精靈彷彿又再一次從瓶中被釋放出來了。」 《區塊鍊革命》 這輯《秘笈症候群》召喚到知名的科技角色—「AI」來參與訪談。但我們保證本集的內容全都是真人生成與發言 😉。 近幾個月來,隨著越來越讓人驚奇的人工智慧技術不斷釋出,AI生成式內容(AIGC)已經成為了一個備受矚目的話題。這種技術可以讓機器
Thumbnail
「科技精靈彷彿又再一次從瓶中被釋放出來了。」 《區塊鍊革命》 這輯《秘笈症候群》召喚到知名的科技角色—「AI」來參與訪談。但我們保證本集的內容全都是真人生成與發言 😉。 近幾個月來,隨著越來越讓人驚奇的人工智慧技術不斷釋出,AI生成式內容(AIGC)已經成為了一個備受矚目的話題。這種技術可以讓機器
Thumbnail
前陣子與朋友吃飯,聊到AI的話題時,我們在媒體上都有共同的感受,報導的內容都是憂心大過於開心,內容皆著作XX職業將被AI取代。 果真是如此嗎,當我利用丹尼爾康納曼的「快思與慢想後」,我發覺AI的發明對我來說反而是創作的利器,怎麼說呢?
Thumbnail
前陣子與朋友吃飯,聊到AI的話題時,我們在媒體上都有共同的感受,報導的內容都是憂心大過於開心,內容皆著作XX職業將被AI取代。 果真是如此嗎,當我利用丹尼爾康納曼的「快思與慢想後」,我發覺AI的發明對我來說反而是創作的利器,怎麼說呢?
Thumbnail
前言 AI人工智慧已經無孔不入的進入我們的日常生活中, 像是最火紅的ChatGPT、Midjourney…等等。 很多人不同的生成式AI創作歌曲、繪畫、寫文章、寫論文! 下一步是不是「自己的工作會被AI取代」? 讓我們一起來探討它! 何謂AI? AI(人工智慧)是人類設計出來的程式或機器所展現的智慧
Thumbnail
前言 AI人工智慧已經無孔不入的進入我們的日常生活中, 像是最火紅的ChatGPT、Midjourney…等等。 很多人不同的生成式AI創作歌曲、繪畫、寫文章、寫論文! 下一步是不是「自己的工作會被AI取代」? 讓我們一起來探討它! 何謂AI? AI(人工智慧)是人類設計出來的程式或機器所展現的智慧
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News