發現薇趨勢／生成式AI時代需要有人味的聲音

2024/09/18 更新2023/09/19 發佈閱讀 3 分鐘

今年年初，OpenAI推出ChatGPT應用程式，正式開啟了全球生成式AI（AI Gernative Content; AIGC）的序幕。

目前表現較出色的，文字生成有ChatGPT和文心一言，圖片生成有Midjourney，影片生成有DeepBrain和Kaiber，聲音生成則有Fliki和LOVO，這些都是科技創新的一大突破。

這項新技術悄悄進入我們的生活與工作場域，許多專欄與新聞開始關注使用者──「人」，未來究竟還有多少工作機會？科技將如何取代人類的工作？

前陣子跟一位公司創辦人聊天，他說公司裡的文字編輯相當抗拒使用ChatGPT，原因是擔心有朝一日被取代。創辦人苦口婆心告訴員工，若是擅長的專業，應當是親自撰寫文章；但碰到不熟悉的領域，生成式AI發揮的效力，也許比「人」還好。因此他鼓勵員工發揮自己的才華之外，也該讓生成式AI提高生產效率。

員工嘴上雖然說好，但產出的作品很明顯的沒有與這位敏捷的「助手」協作。最後，員工遭解雇，創辦人自己用生成式AI輔助，兼職當文字編輯。

生成式AI運用在影片場域，大致有兩種模式：一種是從文本變成影片，近期已有國內電視台使用AI虛擬主播播報新聞；另一種則是由AI讀取文本內容後，從資料庫抓取適合的圖片或影像。

那麼聲音呢？其實坊間有許多AI生成聲音的應用軟體，我也嘗試使用了目前比較流行的幾種。有意思的是，目前支援跨語言生成聲音內容已不成問題，若讀者常使用Youtube和抖音Tiktok，不難發現許多敘述電影故事的影片，搭配了「清新男聲」，就算是不同創作者上傳的影片，聲音也都如出一轍，其實那些都是利用生成式AI合成的聲音。

近期與另一好友聚會，他旗下的企業算是國內AI生成的佼佼者，透過錄音，能訓練語音模型，一旦訓練完成，就能讓專屬你的AI發出你的聲音。

既然聲音可以拷貝，那「人」的價值在哪裡呢？在情緒。

好友說目前他們製作的音檔，比較適合播報新聞或旁白，若要表現情緒，只能放慢語速或增加重音。他們的產品搭配AI生成影像，因此可以透過人的表情，加深聲音表情。

國外某些AI語音模型雖然可以選擇情緒，但假的AI語音跟真人在情感表達與傳遞能力上，確實有落差。

再者，情緒選擇需要批次處理，也就是一個故事如果出現的情緒有十種，不同段落的生成，需要批次處理再剪輯。目前比較受歡迎的幾種AI語音模型，也只有特定幾個聲音能選擇情緒。

在生成式AI席捲全球的同時，備受關注的議題，除了人的價值，就是AI內容產出的所有權與智慧財產權了。

智慧財產權，原則上歸屬於法人或自然人，而AI生成的內容顯然介於模糊地帶。若只是利用AI輔助生成，主要創作者是人，那麼權利自然歸人；但創作者若只是下指令，圖片產出由AI操刀，創作者使用AI究竟屬於輔助創作，還是獨立創作？

用自己的聲音訓練的模型，就算產出了熱呼呼的內容，聲音情緒卻是冷冰冰的，著實乏味；一篇感動五內的故事，變成不帶情緒的新聞播報，未免可惜。在AIGC盛行的年代，有人味的聲音，還是最容易凸顯人的價值。

留言

留言分享你的想法！

王薇瑄的沙龍

25會員

117內容數

Podcast節目【數位趨勢醬子讀】的專欄作家文章匯流從科技新聞帶你看產業趨勢，有別於坊間搖旗吶喊式的附和，本節目提供的獨家觀點絕對讓你耳目一新！你想知道科技新聞背後的微趨勢將如何改變我們的未來嗎?跟著兩位專欄名家一起看就世界還沒發現的微趨勢吧！

王薇瑄的沙龍的其他內容

2025/04/29

發現薇趨勢／別讓 AI 成濫權的遮羞布

西班牙近期推出《人工智慧良善使用與治理法》草案，引發社會強烈反彈。該草案延續歐盟AI法規，對企業使用高風險或禁用技術祭出重罰，但對政府部門的違規行為，僅以「警告」與「紀律處分」帶過，形同免責。此種制度設計讓人質疑：當AI成為國家治理工具，誰來監控擁有監控權力的機構？

2025/04/29

發現薇趨勢／別讓 AI 成濫權的遮羞布

2025/04/15

發現薇趨勢／從自由市場到關稅槓桿

4月初，美國總統川普宣布對多國進口商品加徵新一輪關稅，乍看是選舉年再度上演的經濟民族主義，實則是一次以關稅為槓桿的全球權力重構。這場關稅行動，打著保護本土產業的旗號，卻充滿選擇性與策略性操作，既向選民展示強硬姿態，又保留與盟國談判的籌碼。

2025/04/15

發現薇趨勢／從自由市場到關稅槓桿

2025/04/01

發現薇趨勢／美中 AI 創新擠牙膏vs.普及化

AI正改寫21世紀的產業版圖。中美兩國的人工智慧競爭，不只是技術領先的角力，更是一場制度模型與產業結構的對決。兩國分別在政策驅動與市場機制下走出不同節奏，也映照出背後深層的地緣戰略與價值選擇。

2025/04/01

發現薇趨勢／美中 AI 創新擠牙膏vs.普及化

#創作的其他內容

香水百合四歲了！方格子歷程分享：從 Tinder 約會記錄，到情慾語音創作經營

你可能也想看

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

#懶人料理#食譜#健康甜點

2025/10/15

Sylvie的移動城堡

AIGC對創作者的助力與限制？

人工智慧生成內容（AIGC）的崛起，AI在文字、圖像、產品文案等方面的應用正掀起波瀾。本文分享了使用ChatGPT進行文案撰寫以及對於咒語格式與最佳內容認知的觀察。不過，使用者的專業程度對合作成果至關重要。另外，文章觸及使用AI工具提供的功能性應用，以及在創作和發展方面的潛力。

2024/02/16

2024/02/16

生成式AI，這不僅僅是一個新奇的技術詞彙，它正在全方位地重新塑造我們的日常和商業格局。從你的智能手機到車上的自駕功能，再到商家使用的各式創新工具，AI已經不再陌生。而當我們提到生成式AI應用程序，例如ChatGPT、GitHub Copilot和Stable Diffusion等，它們已經成為了話題

#生成式AI#ChatGPT#OpenAI

2023/10/02

夏天不上班的沙龍

生成式AI：重新塑造現代生活和商業的革命

#生成式AI#ChatGPT#OpenAI

2023/10/02

威利財經生活隨筆的沙龍

AI寫作革命：如何快速創作個人風格文章，傳遞你的靈魂

文摘:我最近採用了新的寫作方式，利用AI將我錄製的播客內容轉換成文章形式。這個過程需要使用兩套AI程式，分別是雅婷語音轉逐字稿和ChatGPT。以往直接將語音轉換成逐字稿是不實用的，因為缺乏邏輯結構，需要耗費大量時間整理。但現在有了ChatGPT，它可以將逐字稿轉換成有邏輯結構的文章初稿，我再進行修

#文章#ChatGPT#寫作

2023/06/21