發現薇趨勢／生成式AI時代需要有人味的聲音

2023/09/19閱讀時間約 3 分鐘

今年年初，OpenAI推出ChatGPT應用程式，正式開啟了全球生成式AI（AI Gernative Content; AIGC）的序幕。

目前表現較出色的，文字生成有ChatGPT和文心一言，圖片生成有Midjourney，影片生成有DeepBrain和Kaiber，聲音生成則有Fliki和LOVO，這些都是科技創新的一大突破。

這項新技術悄悄進入我們的生活與工作場域，許多專欄與新聞開始關注使用者──「人」，未來究竟還有多少工作機會？科技將如何取代人類的工作？

前陣子跟一位公司創辦人聊天，他說公司裡的文字編輯相當抗拒使用ChatGPT，原因是擔心有朝一日被取代。創辦人苦口婆心告訴員工，若是擅長的專業，應當是親自撰寫文章；但碰到不熟悉的領域，生成式AI發揮的效力，也許比「人」還好。因此他鼓勵員工發揮自己的才華之外，也該讓生成式AI提高生產效率。

員工嘴上雖然說好，但產出的作品很明顯的沒有與這位敏捷的「助手」協作。最後，員工遭解雇，創辦人自己用生成式AI輔助，兼職當文字編輯。

生成式AI運用在影片場域，大致有兩種模式：一種是從文本變成影片，近期已有國內電視台使用AI虛擬主播播報新聞；另一種則是由AI讀取文本內容後，從資料庫抓取適合的圖片或影像。

那麼聲音呢？其實坊間有許多AI生成聲音的應用軟體，我也嘗試使用了目前比較流行的幾種。有意思的是，目前支援跨語言生成聲音內容已不成問題，若讀者常使用Youtube和抖音Tiktok，不難發現許多敘述電影故事的影片，搭配了「清新男聲」，就算是不同創作者上傳的影片，聲音也都如出一轍，其實那些都是利用生成式AI合成的聲音。

近期與另一好友聚會，他旗下的企業算是國內AI生成的佼佼者，透過錄音，能訓練語音模型，一旦訓練完成，就能讓專屬你的AI發出你的聲音。

既然聲音可以拷貝，那「人」的價值在哪裡呢？在情緒。

好友說目前他們製作的音檔，比較適合播報新聞或旁白，若要表現情緒，只能放慢語速或增加重音。他們的產品搭配AI生成影像，因此可以透過人的表情，加深聲音表情。

國外某些AI語音模型雖然可以選擇情緒，但假的AI語音跟真人在情感表達與傳遞能力上，確實有落差。

再者，情緒選擇需要批次處理，也就是一個故事如果出現的情緒有十種，不同段落的生成，需要批次處理再剪輯。目前比較受歡迎的幾種AI語音模型，也只有特定幾個聲音能選擇情緒。

在生成式AI席捲全球的同時，備受關注的議題，除了人的價值，就是AI內容產出的所有權與智慧財產權了。

智慧財產權，原則上歸屬於法人或自然人，而AI生成的內容顯然介於模糊地帶。若只是利用AI輔助生成，主要創作者是人，那麼權利自然歸人；但創作者若只是下指令，圖片產出由AI操刀，創作者使用AI究竟屬於輔助創作，還是獨立創作？

用自己的聲音訓練的模型，就算產出了熱呼呼的內容，聲音情緒卻是冷冰冰的，著實乏味；一篇感動五內的故事，變成不帶情緒的新聞播報，未免可惜。在AIGC盛行的年代，有人味的聲音，還是最容易凸顯人的價值。

24會員

92內容數

Podcast節目【數位趨勢醬子讀】的專欄作家文章匯流從科技新聞帶你看產業趨勢，有別於坊間搖旗吶喊式的附和，本節目提供的獨家觀點絕對讓你耳目一新！你想知道科技新聞背後的微趨勢將如何改變我們的未來嗎?跟著兩位專欄名家一起看就世界還沒發現的微趨勢吧！

留言0

查看全部

發表第一個留言支持創作者！

王薇瑄的沙龍的其他內容

應對孩子的數位化早熟

By 王薇瑄聲鮮時采科技營運長、科技媒體專欄作家恰逢七月，我任職的單位舉辦孩子的夏令營，加強小學五年級到國中三年級學生的口語傳播能力。短短三天，我訝異現在的孩子獲得的資訊量，遠遠超出我同齡的時候。課程中，有個小學五年級的孩子分享他對「人的價值」的想法。當老師還在讚嘆十歲年紀竟想談如此有意義

#孩子 #資訊 #分享

發現薇趨勢／從Twitter改名X 看馬斯克雄心

特斯拉創辦人伊隆．馬斯克近幾年的行為讓人不解，他打造星鏈，火箭載人上太空，買下推特（Twitter）等，眾人彷彿霧裡看花，不知他在玩什麼把戲。但若熟悉數位匯流的發展脈絡，則不得不佩服這位數位新鬼才的策略與盤算。

#馬斯克 #訊號 #Twitter

發現薇趨勢／全球化與反全球化

前陣子，中華民國工商協進會會員大會上，台積電創辦人張忠謀先生發表了演說，主題是重新定義全球化。他提到，過去全球化的定義是「不顧國界、追求商業利潤，承擔商業風險」，但目前的全球氛圍與20年前大相逕庭，全球化的新定義是「在不傷害國家安全與科技經濟領先條件下，允許企業在國外牟利，也允許外國產品進口」。

#全球化 #產品 #台積電

發現薇趨勢／培養孩子數位素養

每年7月，許多學生殷殷期盼的暑假來了，各式各樣的夏令營與課程也如火如荼展開。近期與朋友聚會，意外得知幾位科技公司高階主管與創業家，都禁止孩子使用智慧型手機與電腦。

#數位 #智慧型手機 #孩子

發現薇趨勢／促進性別平等支持女性創業

近期MeToo事件延燒，政治界、學術界、娛樂圈、藝術產業無不砲火頻仍，讀者應接不暇。 MeToo最早追溯到2006年，由社會活動與社區組織者塔拉納．伯克發起，當時是針對被性侵犯的有色人種，特別是向底層女性推廣「用同理心實現賦權」的運動。

#女性 #創業 #企業家

發現薇趨勢／Vision Pro亮相零距離新體驗

2023年6月5日登場的WWDC開發者大會，蘋果終於展示了全球昂首期盼的虛擬頭戴裝置「Vision Pro」。自2021年Meta創辦人祖克柏提出「元宇宙」概念後，AR、VR、MR、XR供應鏈及技術開發廠商便湧動了一波虛擬世界的熱潮。

#Vision Pro #智慧型手機 #蘋果公司

本篇參與的主題策展

睡不著的夜

目前共 20931 篇

日常手帖

2024/10/31

上班一條蟲，放假一條龍

#颱風天 #水彩 #創作

照夜白的世界

2024/10/27

《Grimpoteuthis umbellata》草圖

#照夜白 #照夜白原創作品 #軟體動物觀察日記

托馬斯的社群咖啡館

2022/05/22

VAF story - 序

時間是2123年，那是一個下著雨的夜晚，冷風一波接著一波颳起，碩大的雨滴一滴滴地落在金屬上。多拉格睜開了雙眼，眼前是一扇窗戶，窗外一片黑暗，他發現自己在一個狹窄的空間裡，那是一個冷凍艙……

#創作 #VAF二創小宇宙 #FallenContact

泯滅天使唱遊地

2022/05/19

【新詩】低語

不再證明了／不再為了那些不証自明的事情／焚燒，或凋萎／房間逼仄但內心昶亮／虔恭迎接每個早上／晨光穿窗而來

#新詩 #創作 #文學創作

戀芯的沙龍

2022/05/11

永恆之旅 1.前言

前言宇希333年現在是第14號地球世界的火曆2309年。病毒「無」專門吞噬「感情」、「感覺」、「愛」、「希望」，大部份被感染的人都無法呈現臉部表情，人類也越來越冷漠。幸虧第14號地球的科技相當發達，腦細胞可以連線面具讓人可以戴著精緻的面具過活，戴面具的人只要用想的就可以呈現臉部的表情。

APOW's即興。音樂。創作

2022/04/27

假裝是詩〈偶爾〉

以為擁有的 / 其實尚未 / 以為失去的 / 或許換成了另一種獲得

#文字 #創作 #詩

日常手帖

2024/10/31

上班一條蟲，放假一條龍

#颱風天 #水彩 #創作

照夜白的世界

2024/10/27

《Grimpoteuthis umbellata》草圖

#照夜白 #照夜白原創作品 #軟體動物觀察日記

托馬斯的社群咖啡館

2022/05/22

VAF story - 序

#創作 #VAF二創小宇宙 #FallenContact

泯滅天使唱遊地

2022/05/19

【新詩】低語

不再證明了／不再為了那些不証自明的事情／焚燒，或凋萎／房間逼仄但內心昶亮／虔恭迎接每個早上／晨光穿窗而來

#新詩 #創作 #文學創作

戀芯的沙龍

2022/05/11

永恆之旅 1.前言

APOW's即興。音樂。創作

2022/04/27

假裝是詩〈偶爾〉

以為擁有的 / 其實尚未 / 以為失去的 / 或許換成了另一種獲得

#文字 #創作 #詩

你可能也想看

Google News 追蹤

方格子 vocus 官方沙龍

2024/10/21

「天天秋嗨嗨」：vocus 秋季徵文，五大主題 & 獎品登場！

這個秋，Chill 嗨嗨！穿搭美美去賞楓，裝備款款去露營⋯⋯你的秋天怎麼過？秋日 To Do List 等你分享！秋季全站徵文，我們準備了五個創作主題，參賽還有機會獲得「火烤兩用鍋」，一起來看看如何參加吧～

#天天秋嗨嗨 #秋季旅遊 #秋季穿搭

MimiVsJames的美股投資分享

2024/11/03

美國大選『終局之戰』（Endgame）即將展開，美股將迎來新世紀？（上篇：模型推導寶座花落誰家？）

美國總統大選只剩下三天，我們觀察一整週民調與金融市場的變化（包含賭局），到本週五下午3:00前為止，誰是美國總統幾乎大概可以猜到60-70%的機率，本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變

#美股 #美國大選 #投資理財

矮袋鼠律師的沙龍

2024/11/03

如果這個世界有神，那祂一定姓李名相赫｜矮袋鼠律師

Faker昨天真的太扯了，中國主播王多多點評的話更是精妙，分享給各位王多多的點評「Faker是我們的處境，他是LPL永遠繞不開的一個人和話題，所以我們特別渴望在決賽跟他相遇，去直面我們的處境。我們曾經稱他為最高的山，最長的河，以為山海就是盡頭，可是Faker用他28歲的年齡...

#Faker #電競 #運動

王薇瑄的沙龍

2024/09/03

發現薇趨勢／雲端與終端之戰風雲錄

時常關注科技產業新聞的讀者，應該對一張圖有印象。畫面左上角寫著「Before」，幾隻幼兒忍者龜牽著他們的師父斯普林特大師往前走。幼兒忍者龜背後分別寫著HP、Cisco、Oracle、Intel、微軟，而師父斯普林特大師背後，則是斗大的「IBM」。

#IBM #AI #美國

王薇瑄的沙龍

2024/08/20

發現薇趨勢／聲音品牌打入人心

品牌是什麼？是Logo背後的價值意義？不斷露出的電視廣告？還是消費者購買行為決策前腦海中的跑馬燈？我們過去熟悉的「品牌」，經過科技的日新月異與時間的推移，不同世代對於品牌的認知出現落差。

#聲音內容 #品牌行銷 #廣告

王薇瑄的沙龍

2024/08/06

發現薇趨勢／迎接生成式藝術浪潮

當人工智慧生成的文字、圖片與影像引爆全球，有一個產業正因此躍入大眾視野，那就是「生成式藝術」產業。什麼是生成式藝術？一種是使用者透過商業化介面，輸入畫面描述關鍵字後所生成的圖片；另一種是創作者透過自身編碼能力，或啟發自開源式（Open Source）編碼，加入自我創意後所產出的藝術品。

#藝術家 #人工智慧 #虛擬貨幣

王薇瑄的沙龍

2024/07/23

發現薇趨勢／復刻科技巨擘初心

近期推出的新社群媒體Noplace，在App Store上架才一天，就擠下了TikTok跟Threads，伺服器還一度過載。這個社群媒體與我們熟悉的Facebook、Instagram和X有什麼不同？為何大家趨之若鶩？

#Noplace #社群媒體 #廣告

王薇瑄的沙龍

2024/07/09

發現薇趨勢／保護本土產業台灣應積極發聲

不知道從什麼時候開始，「地球村」的概念已融入我們的生活與工作。台北街頭隨處可見星巴克，也可零時差觀看歐美運動賽事轉播，海外商品平行輸入國內市場，點開影音串流平台則迅速接上國際產出的內容。

#廣告 #歐盟 #Google

漢克魏「漢克魏景觀站」的沙龍

2023/04/30

正所謂危機就是轉機，遇見的處境未必是最糟糕的，只是你一直沒有發現身邊的好。

【正所謂危機就是轉機，遇見的處境未必是最糟糕的，只是你一直沒有發現身邊的好】有時不得不相信很多是真的很玄，要說吸引力法則也好，也可能說是運氣真的很好，不管如此都不要放棄希望，都不要不相信自己有好運氣的存在。面臨到轉職的期間，原先預期的月底離職日，沒想到卻意外更快的完成，約兩個禮拜就完成了交接，順

#危機 #轉機 #好運

chodamal的沙龍

2022/12/14

微和輝達的台裔CEO都親臨現場發表賀詞時

前言：本文為綜合了《日經亞洲》雜誌四篇報導的重要資訊所寫成，在台積電的亞利桑那新廠剛舉行設備裝設完成慶祝典禮，美國總統和美國晶片業兩大巨頭超微和輝達的台裔CEO都親臨現場發表賀詞時，在這場重組全球晶片供應鏈的無硝煙戰爭中處於落後的前冠軍日本、從零開始的新玩家印度還有原本在過去十年急起直追卻接連被兩任