發現薇趨勢/生成式AI時代 需要有人味的聲音

更新於 發佈於 閱讀時間約 3 分鐘

今年年初,OpenAI推出ChatGPT應用程式,正式開啟了全球生成式AI(AI Gernative Content; AIGC)的序幕。

目前表現較出色的,文字生成有ChatGPT和文心一言,圖片生成有Midjourney,影片生成有DeepBrain和Kaiber,聲音生成則有Fliki和LOVO,這些都是科技創新的一大突破。

這項新技術悄悄進入我們的生活與工作場域,許多專欄與新聞開始關注使用者──「人」,未來究竟還有多少工作機會?科技將如何取代人類的工作?

前陣子跟一位公司創辦人聊天,他說公司裡的文字編輯相當抗拒使用ChatGPT,原因是擔心有朝一日被取代。創辦人苦口婆心告訴員工,若是擅長的專業,應當是親自撰寫文章;但碰到不熟悉的領域,生成式AI發揮的效力,也許比「人」還好。因此他鼓勵員工發揮自己的才華之外,也該讓生成式AI提高生產效率。

員工嘴上雖然說好,但產出的作品很明顯的沒有與這位敏捷的「助手」協作。最後,員工遭解雇,創辦人自己用生成式AI輔助,兼職當文字編輯。

生成式AI運用在影片場域,大致有兩種模式:一種是從文本變成影片,近期已有國內電視台使用AI虛擬主播播報新聞;另一種則是由AI讀取文本內容後,從資料庫抓取適合的圖片或影像。

那麼聲音呢?其實坊間有許多AI生成聲音的應用軟體,我也嘗試使用了目前比較流行的幾種。有意思的是,目前支援跨語言生成聲音內容已不成問題,若讀者常使用Youtube和抖音Tiktok,不難發現許多敘述電影故事的影片,搭配了「清新男聲」,就算是不同創作者上傳的影片,聲音也都如出一轍,其實那些都是利用生成式AI合成的聲音。

近期與另一好友聚會,他旗下的企業算是國內AI生成的佼佼者,透過錄音,能訓練語音模型,一旦訓練完成,就能讓專屬你的AI發出你的聲音。

既然聲音可以拷貝,那「人」的價值在哪裡呢?在情緒。

好友說目前他們製作的音檔,比較適合播報新聞或旁白,若要表現情緒,只能放慢語速或增加重音。他們的產品搭配AI生成影像,因此可以透過人的表情,加深聲音表情。

國外某些AI語音模型雖然可以選擇情緒,但假的AI語音跟真人在情感表達與傳遞能力上,確實有落差。

再者,情緒選擇需要批次處理,也就是一個故事如果出現的情緒有十種,不同段落的生成,需要批次處理再剪輯。目前比較受歡迎的幾種AI語音模型,也只有特定幾個聲音能選擇情緒。

在生成式AI席捲全球的同時,備受關注的議題,除了人的價值,就是AI內容產出的所有權與智慧財產權了。

智慧財產權,原則上歸屬於法人或自然人,而AI生成的內容顯然介於模糊地帶。若只是利用AI輔助生成,主要創作者是人,那麼權利自然歸人;但創作者若只是下指令,圖片產出由AI操刀,創作者使用AI究竟屬於輔助創作,還是獨立創作?

用自己的聲音訓練的模型,就算產出了熱呼呼的內容,聲音情緒卻是冷冰冰的,著實乏味;一篇感動五內的故事,變成不帶情緒的新聞播報,未免可惜。在AIGC盛行的年代,有人味的聲音,還是最容易凸顯人的價值。

留言
avatar-img
留言分享你的想法!
avatar-img
王薇瑄的沙龍
24會員
109內容數
Podcast節目【數位趨勢醬子讀】的專欄作家文章匯流 從科技新聞帶你看產業趨勢,有別於坊間搖旗吶喊式的附和,本節目提供的獨家觀點絕對讓你耳目一新! 你想知道科技新聞背後的微趨勢將如何改變我們的未來嗎?跟著兩位專欄名家一起看就世界還沒發現的微趨勢吧!
王薇瑄的沙龍的其他內容
2025/04/29
西班牙近期推出《人工智慧良善使用與治理法》草案,引發社會強烈反彈。該草案延續歐盟AI法規,對企業使用高風險或禁用技術祭出重罰,但對政府部門的違規行為,僅以「警告」與「紀律處分」帶過,形同免責。此種制度設計讓人質疑:當AI成為國家治理工具,誰來監控擁有監控權力的機構?
2025/04/29
西班牙近期推出《人工智慧良善使用與治理法》草案,引發社會強烈反彈。該草案延續歐盟AI法規,對企業使用高風險或禁用技術祭出重罰,但對政府部門的違規行為,僅以「警告」與「紀律處分」帶過,形同免責。此種制度設計讓人質疑:當AI成為國家治理工具,誰來監控擁有監控權力的機構?
2025/04/15
4月初,美國總統川普宣布對多國進口商品加徵新一輪關稅,乍看是選舉年再度上演的經濟民族主義,實則是一次以關稅為槓桿的全球權力重構。這場關稅行動,打著保護本土產業的旗號,卻充滿選擇性與策略性操作,既向選民展示強硬姿態,又保留與盟國談判的籌碼。
2025/04/15
4月初,美國總統川普宣布對多國進口商品加徵新一輪關稅,乍看是選舉年再度上演的經濟民族主義,實則是一次以關稅為槓桿的全球權力重構。這場關稅行動,打著保護本土產業的旗號,卻充滿選擇性與策略性操作,既向選民展示強硬姿態,又保留與盟國談判的籌碼。
2025/04/01
AI正改寫21世紀的產業版圖。中美兩國的人工智慧競爭,不只是技術領先的角力,更是一場制度模型與產業結構的對決。兩國分別在政策驅動與市場機制下走出不同節奏,也映照出背後深層的地緣戰略與價值選擇。
2025/04/01
AI正改寫21世紀的產業版圖。中美兩國的人工智慧競爭,不只是技術領先的角力,更是一場制度模型與產業結構的對決。兩國分別在政策驅動與市場機制下走出不同節奏,也映照出背後深層的地緣戰略與價值選擇。
看更多
你可能也想看
Thumbnail
孩子寫功課時瞇眼?小心近視!這款喜光全光譜TIONE⁺光健康智慧檯燈,獲眼科院長推薦,網路好評不斷!全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉,讓孩子學習更舒適、保護眼睛!
Thumbnail
孩子寫功課時瞇眼?小心近視!這款喜光全光譜TIONE⁺光健康智慧檯燈,獲眼科院長推薦,網路好評不斷!全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉,讓孩子學習更舒適、保護眼睛!
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
人工智慧生成內容(AIGC)的崛起,AI在文字、圖像、產品文案等方面的應用正掀起波瀾。本文分享了使用ChatGPT進行文案撰寫以及對於咒語格式與最佳內容認知的觀察。不過,使用者的專業程度對合作成果至關重要。另外,文章觸及使用AI工具提供的功能性應用,以及在創作和發展方面的潛力。
Thumbnail
人工智慧生成內容(AIGC)的崛起,AI在文字、圖像、產品文案等方面的應用正掀起波瀾。本文分享了使用ChatGPT進行文案撰寫以及對於咒語格式與最佳內容認知的觀察。不過,使用者的專業程度對合作成果至關重要。另外,文章觸及使用AI工具提供的功能性應用,以及在創作和發展方面的潛力。
Thumbnail
生成式AI,這不僅僅是一個新奇的技術詞彙,它正在全方位地重新塑造我們的日常和商業格局。從你的智能手機到車上的自駕功能,再到商家使用的各式創新工具,AI已經不再陌生。而當我們提到生成式AI應用程序,例如ChatGPT、GitHub Copilot和Stable Diffusion等,它們已經成為了話題
Thumbnail
生成式AI,這不僅僅是一個新奇的技術詞彙,它正在全方位地重新塑造我們的日常和商業格局。從你的智能手機到車上的自駕功能,再到商家使用的各式創新工具,AI已經不再陌生。而當我們提到生成式AI應用程序,例如ChatGPT、GitHub Copilot和Stable Diffusion等,它們已經成為了話題
Thumbnail
文摘:我最近採用了新的寫作方式,利用AI將我錄製的播客內容轉換成文章形式。這個過程需要使用兩套AI程式,分別是雅婷語音轉逐字稿和ChatGPT。以往直接將語音轉換成逐字稿是不實用的,因為缺乏邏輯結構,需要耗費大量時間整理。但現在有了ChatGPT,它可以將逐字稿轉換成有邏輯結構的文章初稿,我再進行修
Thumbnail
文摘:我最近採用了新的寫作方式,利用AI將我錄製的播客內容轉換成文章形式。這個過程需要使用兩套AI程式,分別是雅婷語音轉逐字稿和ChatGPT。以往直接將語音轉換成逐字稿是不實用的,因為缺乏邏輯結構,需要耗費大量時間整理。但現在有了ChatGPT,它可以將逐字稿轉換成有邏輯結構的文章初稿,我再進行修
Thumbnail
你試用過人工智能(AI)文字轉語音功能了嗎? AI語音發展已經可高效地產出仿人聲語音,那麼,朗誦員、配音員的工作量是否會急遽減少呢? 現在爭議的問題點在於:業界人士發現有服務提供者混合市面上數種人聲錄音創造AI音頻,但沒有經過授權同意,侵害到原作者智慧財產權。 本篇文章介紹Google自動朗誦及AI
Thumbnail
你試用過人工智能(AI)文字轉語音功能了嗎? AI語音發展已經可高效地產出仿人聲語音,那麼,朗誦員、配音員的工作量是否會急遽減少呢? 現在爭議的問題點在於:業界人士發現有服務提供者混合市面上數種人聲錄音創造AI音頻,但沒有經過授權同意,侵害到原作者智慧財產權。 本篇文章介紹Google自動朗誦及AI
Thumbnail
「科技精靈彷彿又再一次從瓶中被釋放出來了。」 《區塊鍊革命》 這輯《秘笈症候群》召喚到知名的科技角色—「AI」來參與訪談。但我們保證本集的內容全都是真人生成與發言 😉。 近幾個月來,隨著越來越讓人驚奇的人工智慧技術不斷釋出,AI生成式內容(AIGC)已經成為了一個備受矚目的話題。這種技術可以讓機器
Thumbnail
「科技精靈彷彿又再一次從瓶中被釋放出來了。」 《區塊鍊革命》 這輯《秘笈症候群》召喚到知名的科技角色—「AI」來參與訪談。但我們保證本集的內容全都是真人生成與發言 😉。 近幾個月來,隨著越來越讓人驚奇的人工智慧技術不斷釋出,AI生成式內容(AIGC)已經成為了一個備受矚目的話題。這種技術可以讓機器
Thumbnail
前陣子與朋友吃飯,聊到AI的話題時,我們在媒體上都有共同的感受,報導的內容都是憂心大過於開心,內容皆著作XX職業將被AI取代。 果真是如此嗎,當我利用丹尼爾康納曼的「快思與慢想後」,我發覺AI的發明對我來說反而是創作的利器,怎麼說呢?
Thumbnail
前陣子與朋友吃飯,聊到AI的話題時,我們在媒體上都有共同的感受,報導的內容都是憂心大過於開心,內容皆著作XX職業將被AI取代。 果真是如此嗎,當我利用丹尼爾康納曼的「快思與慢想後」,我發覺AI的發明對我來說反而是創作的利器,怎麼說呢?
Thumbnail
前言 AI人工智慧已經無孔不入的進入我們的日常生活中, 像是最火紅的ChatGPT、Midjourney…等等。 很多人不同的生成式AI創作歌曲、繪畫、寫文章、寫論文! 下一步是不是「自己的工作會被AI取代」? 讓我們一起來探討它! 何謂AI? AI(人工智慧)是人類設計出來的程式或機器所展現的智慧
Thumbnail
前言 AI人工智慧已經無孔不入的進入我們的日常生活中, 像是最火紅的ChatGPT、Midjourney…等等。 很多人不同的生成式AI創作歌曲、繪畫、寫文章、寫論文! 下一步是不是「自己的工作會被AI取代」? 讓我們一起來探討它! 何謂AI? AI(人工智慧)是人類設計出來的程式或機器所展現的智慧
Thumbnail
最近ChatGPT 紅到我爸媽都在問了,相信不少人已經聽過它。這是一個非常令人印象深刻的聊天機器人,由一家名為 OpenAI 的公司創建,並於去年 11 月向公眾發布,它使用生成式 AI(Generative AI)。通過吸收大量由實際人類撰寫的文章,ChatGPT 可以提供各種各樣的文字,從歌詞到
Thumbnail
最近ChatGPT 紅到我爸媽都在問了,相信不少人已經聽過它。這是一個非常令人印象深刻的聊天機器人,由一家名為 OpenAI 的公司創建,並於去年 11 月向公眾發布,它使用生成式 AI(Generative AI)。通過吸收大量由實際人類撰寫的文章,ChatGPT 可以提供各種各樣的文字,從歌詞到
Thumbnail
本篇文章在分享親身體驗使用AI輔助創作的過程。文章中可以看到作者第一手的經驗與描述,如何運用ChatGPT、Midjourney、Speech to Text、Autotag等眾多工具來進行輔助,以及最終的成果
Thumbnail
本篇文章在分享親身體驗使用AI輔助創作的過程。文章中可以看到作者第一手的經驗與描述,如何運用ChatGPT、Midjourney、Speech to Text、Autotag等眾多工具來進行輔助,以及最終的成果
Thumbnail
從2022年末到最近,繪圖、寫作、簡報這三項跟工作相關的任務,迎來重大衝擊——它們都有對應的AI軟體,且能做出大致符合需求的內容。 然而,仰賴AI產生內容的同時,我們獲得了什麼,又(即將)失去了什麼呢?
Thumbnail
從2022年末到最近,繪圖、寫作、簡報這三項跟工作相關的任務,迎來重大衝擊——它們都有對應的AI軟體,且能做出大致符合需求的內容。 然而,仰賴AI產生內容的同時,我們獲得了什麼,又(即將)失去了什麼呢?
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News