發現薇趨勢/生成式AI時代 需要有人味的聲音

更新於 發佈於 閱讀時間約 3 分鐘

今年年初,OpenAI推出ChatGPT應用程式,正式開啟了全球生成式AI(AI Gernative Content; AIGC)的序幕。

目前表現較出色的,文字生成有ChatGPT和文心一言,圖片生成有Midjourney,影片生成有DeepBrain和Kaiber,聲音生成則有Fliki和LOVO,這些都是科技創新的一大突破。

這項新技術悄悄進入我們的生活與工作場域,許多專欄與新聞開始關注使用者──「人」,未來究竟還有多少工作機會?科技將如何取代人類的工作?

前陣子跟一位公司創辦人聊天,他說公司裡的文字編輯相當抗拒使用ChatGPT,原因是擔心有朝一日被取代。創辦人苦口婆心告訴員工,若是擅長的專業,應當是親自撰寫文章;但碰到不熟悉的領域,生成式AI發揮的效力,也許比「人」還好。因此他鼓勵員工發揮自己的才華之外,也該讓生成式AI提高生產效率。

員工嘴上雖然說好,但產出的作品很明顯的沒有與這位敏捷的「助手」協作。最後,員工遭解雇,創辦人自己用生成式AI輔助,兼職當文字編輯。

生成式AI運用在影片場域,大致有兩種模式:一種是從文本變成影片,近期已有國內電視台使用AI虛擬主播播報新聞;另一種則是由AI讀取文本內容後,從資料庫抓取適合的圖片或影像。

那麼聲音呢?其實坊間有許多AI生成聲音的應用軟體,我也嘗試使用了目前比較流行的幾種。有意思的是,目前支援跨語言生成聲音內容已不成問題,若讀者常使用Youtube和抖音Tiktok,不難發現許多敘述電影故事的影片,搭配了「清新男聲」,就算是不同創作者上傳的影片,聲音也都如出一轍,其實那些都是利用生成式AI合成的聲音。

近期與另一好友聚會,他旗下的企業算是國內AI生成的佼佼者,透過錄音,能訓練語音模型,一旦訓練完成,就能讓專屬你的AI發出你的聲音。

既然聲音可以拷貝,那「人」的價值在哪裡呢?在情緒。

好友說目前他們製作的音檔,比較適合播報新聞或旁白,若要表現情緒,只能放慢語速或增加重音。他們的產品搭配AI生成影像,因此可以透過人的表情,加深聲音表情。

國外某些AI語音模型雖然可以選擇情緒,但假的AI語音跟真人在情感表達與傳遞能力上,確實有落差。

再者,情緒選擇需要批次處理,也就是一個故事如果出現的情緒有十種,不同段落的生成,需要批次處理再剪輯。目前比較受歡迎的幾種AI語音模型,也只有特定幾個聲音能選擇情緒。

在生成式AI席捲全球的同時,備受關注的議題,除了人的價值,就是AI內容產出的所有權與智慧財產權了。

智慧財產權,原則上歸屬於法人或自然人,而AI生成的內容顯然介於模糊地帶。若只是利用AI輔助生成,主要創作者是人,那麼權利自然歸人;但創作者若只是下指令,圖片產出由AI操刀,創作者使用AI究竟屬於輔助創作,還是獨立創作?

用自己的聲音訓練的模型,就算產出了熱呼呼的內容,聲音情緒卻是冷冰冰的,著實乏味;一篇感動五內的故事,變成不帶情緒的新聞播報,未免可惜。在AIGC盛行的年代,有人味的聲音,還是最容易凸顯人的價值。

avatar-img
24會員
101內容數
Podcast節目【數位趨勢醬子讀】的專欄作家文章匯流 從科技新聞帶你看產業趨勢,有別於坊間搖旗吶喊式的附和,本節目提供的獨家觀點絕對讓你耳目一新! 你想知道科技新聞背後的微趨勢將如何改變我們的未來嗎?跟著兩位專欄名家一起看就世界還沒發現的微趨勢吧!
留言
avatar-img
留言分享你的想法!

































































王薇瑄的沙龍 的其他內容
By 王薇瑄 聲鮮時采科技營運長、科技媒體專欄作家 恰逢七月,我任職的單位舉辦孩子的夏令營,加強小學五年級到國中三年級學生的口語傳播能力。短短三天,我訝異現在的孩子獲得的資訊量,遠遠超出我同齡的時候。 課程中,有個小學五年級的孩子分享他對「人的價值」的想法。當老師還在讚嘆十歲年紀竟想談如此有意義
特斯拉創辦人伊隆.馬斯克近幾年的行為讓人不解,他打造星鏈,火箭載人上太空,買下推特(Twitter)等,眾人彷彿霧裡看花,不知他在玩什麼把戲。 但若熟悉數位匯流的發展脈絡,則不得不佩服這位數位新鬼才的策略與盤算。
前陣子,中華民國工商協進會會員大會上,台積電創辦人張忠謀先生發表了演說,主題是重新定義全球化。 他提到,過去全球化的定義是「不顧國界、追求商業利潤,承擔商業風險」,但目前的全球氛圍與20年前大相逕庭,全球化的新定義是「在不傷害國家安全與科技經濟領先條件下,允許企業在國外牟利,也允許外國產品進口」。
每年7月,許多學生殷殷期盼的暑假來了,各式各樣的夏令營與課程也如火如荼展開。近期與朋友聚會,意外得知幾位科技公司高階主管與創業家,都禁止孩子使用智慧型手機與電腦。
近期MeToo事件延燒,政治界、學術界、娛樂圈、藝術產業無不砲火頻仍,讀者應接不暇。 MeToo最早追溯到2006年,由社會活動與社區組織者塔拉納.伯克發起,當時是針對被性侵犯的有色人種,特別是向底層女性推廣「用同理心實現賦權」的運動。
2023年6月5日登場的WWDC開發者大會,蘋果終於展示了全球昂首期盼的虛擬頭戴裝置「Vision Pro」。自2021年Meta創辦人祖克柏提出「元宇宙」概念後,AR、VR、MR、XR供應鏈及技術開發廠商便湧動了一波虛擬世界的熱潮。
By 王薇瑄 聲鮮時采科技營運長、科技媒體專欄作家 恰逢七月,我任職的單位舉辦孩子的夏令營,加強小學五年級到國中三年級學生的口語傳播能力。短短三天,我訝異現在的孩子獲得的資訊量,遠遠超出我同齡的時候。 課程中,有個小學五年級的孩子分享他對「人的價值」的想法。當老師還在讚嘆十歲年紀竟想談如此有意義
特斯拉創辦人伊隆.馬斯克近幾年的行為讓人不解,他打造星鏈,火箭載人上太空,買下推特(Twitter)等,眾人彷彿霧裡看花,不知他在玩什麼把戲。 但若熟悉數位匯流的發展脈絡,則不得不佩服這位數位新鬼才的策略與盤算。
前陣子,中華民國工商協進會會員大會上,台積電創辦人張忠謀先生發表了演說,主題是重新定義全球化。 他提到,過去全球化的定義是「不顧國界、追求商業利潤,承擔商業風險」,但目前的全球氛圍與20年前大相逕庭,全球化的新定義是「在不傷害國家安全與科技經濟領先條件下,允許企業在國外牟利,也允許外國產品進口」。
每年7月,許多學生殷殷期盼的暑假來了,各式各樣的夏令營與課程也如火如荼展開。近期與朋友聚會,意外得知幾位科技公司高階主管與創業家,都禁止孩子使用智慧型手機與電腦。
近期MeToo事件延燒,政治界、學術界、娛樂圈、藝術產業無不砲火頻仍,讀者應接不暇。 MeToo最早追溯到2006年,由社會活動與社區組織者塔拉納.伯克發起,當時是針對被性侵犯的有色人種,特別是向底層女性推廣「用同理心實現賦權」的運動。
2023年6月5日登場的WWDC開發者大會,蘋果終於展示了全球昂首期盼的虛擬頭戴裝置「Vision Pro」。自2021年Meta創辦人祖克柏提出「元宇宙」概念後,AR、VR、MR、XR供應鏈及技術開發廠商便湧動了一波虛擬世界的熱潮。
本篇參與的主題活動
年紀漸長後,我才驚覺,舞台上的歌手們, 多數都已比我年輕。也許正因如此,已很少特別關注哪一位新的歌星。 但方大同,是少數例外。 喜歡他的聲音、他的創作,那獨特的音樂靈魂。他的歌, 有聲音的記憶點,能輕輕敲擊記憶與畫面,喚醒一些獨有的氛圍。 有一段歲月,是香港樂壇輝煌的時代。那時的歌聲與
這是我三天前,摯友限動的內容。 新書《好久不見,靈魂伴侶》出版了,預購期跟正式出版不同,這次出版社和去年一樣是800本親簽。預購是2/21,出版是2/27。 2/21 - 2/26這五天,誠如 IG 的狀態,我聽出版社的話,每天都宣傳。 作家壓力大的部分,除了書市向來低迷,況且
Queen 方格女王是誰?所有為了女性而寫、身為女性而寫的創作者,都是 Queen! 來寫吧!為女性而寫!突破性別框架的日常經歷、職場挑戰、月經謠言終結者,凍卵、懷孕、育兒經驗分享⋯⋯所有成為「她」的人生抉擇,都值得紀錄。 voucs Queen 的一百萬種故事,因你而完整 😍
這篇文章探討了作者在學測作文「關於52赫茲,我想說的是……」後,對於孤獨、生命價值和自我認同的反思。文章藉由《漁父》一課和52赫茲鯨魚的意象,深入探討堅持自我與迎合世俗的掙扎,以及創作的意義與價值。
格友們好,vocus 作為內容平台,我們理解並重視社群互動與回饋對創作者的重要性。為了讓大家在回覆留言時可以更有效率、更直覺,幫助創作者與會員之間的互動更順暢,留言功能升級啦!
在眾多寫作指南中,三浦紫苑的作品別具一格,強調寫作的核心在於品味。透過比喻料理的方式,她為新手作家提供了多方面的寫作建議,不僅涵蓋靈感與文風,還有結構與敘事的技巧。這篇文章探討瞭如何透過生活經驗增強個人品味,尋找寫作中的獨特風格,並鼓勵作家將內心的思考融入創作,創造出更具深度的作品。
年紀漸長後,我才驚覺,舞台上的歌手們, 多數都已比我年輕。也許正因如此,已很少特別關注哪一位新的歌星。 但方大同,是少數例外。 喜歡他的聲音、他的創作,那獨特的音樂靈魂。他的歌, 有聲音的記憶點,能輕輕敲擊記憶與畫面,喚醒一些獨有的氛圍。 有一段歲月,是香港樂壇輝煌的時代。那時的歌聲與
這是我三天前,摯友限動的內容。 新書《好久不見,靈魂伴侶》出版了,預購期跟正式出版不同,這次出版社和去年一樣是800本親簽。預購是2/21,出版是2/27。 2/21 - 2/26這五天,誠如 IG 的狀態,我聽出版社的話,每天都宣傳。 作家壓力大的部分,除了書市向來低迷,況且
Queen 方格女王是誰?所有為了女性而寫、身為女性而寫的創作者,都是 Queen! 來寫吧!為女性而寫!突破性別框架的日常經歷、職場挑戰、月經謠言終結者,凍卵、懷孕、育兒經驗分享⋯⋯所有成為「她」的人生抉擇,都值得紀錄。 voucs Queen 的一百萬種故事,因你而完整 😍
這篇文章探討了作者在學測作文「關於52赫茲,我想說的是……」後,對於孤獨、生命價值和自我認同的反思。文章藉由《漁父》一課和52赫茲鯨魚的意象,深入探討堅持自我與迎合世俗的掙扎,以及創作的意義與價值。
格友們好,vocus 作為內容平台,我們理解並重視社群互動與回饋對創作者的重要性。為了讓大家在回覆留言時可以更有效率、更直覺,幫助創作者與會員之間的互動更順暢,留言功能升級啦!
在眾多寫作指南中,三浦紫苑的作品別具一格,強調寫作的核心在於品味。透過比喻料理的方式,她為新手作家提供了多方面的寫作建議,不僅涵蓋靈感與文風,還有結構與敘事的技巧。這篇文章探討瞭如何透過生活經驗增強個人品味,尋找寫作中的獨特風格,並鼓勵作家將內心的思考融入創作,創造出更具深度的作品。
你可能也想看
Google News 追蹤
Thumbnail
生成式AI的出現對作家產生了深遠的影響,改變了作家創作方式、市場生態和社會價值觀。未來可能出現市場壟斷、收入兩極分化、創作風格同質化等趨勢,也會引發政府幹預、創作市場的變革、社會運動與文化變革等事件。在這樣的環境中,作家需要不斷適應、創新,並挖掘新的市場需求。
Thumbnail
生成式AI(Generative AI)能夠創造新內容和想法,包括對話、故事、圖像、視訊和音樂等。本文將介紹幾種生成式AI模型,以及其在設計製造、教育、客戶服務、媒體與娛樂、市場營銷領域的應用和風險。然後就生成式AI的應用,設計製造、教育、客戶服務、媒體與娛樂、市場營銷等相關領域提供了一些示例。
在當今這個數字化時代,人工智慧的發展日新月異,AI聊天機器人逐漸成為人們生活中不可或缺的一部分。然而,隨著AI技術的不斷進步,人們不禁開始思考一個問題:真人會被AI取代嗎?這個問題引發了人們對於人工智慧與人類之間的比較和交互作用的深入探討。
Thumbnail
這篇文章整理了多種好用的AI工具,涵蓋了聲音與音樂相關的AI、影音、圖像生成編輯工具和AI搜尋引擎等領域,幫助你節省時間和解放創意與生產力。
Thumbnail
與其僅從應用面思考AI,不如瞭解其背後的原理。本文章探討生成式AI的發展及應用,包含使用AI生成文章、影片等的原理和技術。透過AI的世界原理記錄,可以達到應用無窮的效果。
Thumbnail
人工智慧生成內容(AIGC)的崛起,AI在文字、圖像、產品文案等方面的應用正掀起波瀾。本文分享了使用ChatGPT進行文案撰寫以及對於咒語格式與最佳內容認知的觀察。不過,使用者的專業程度對合作成果至關重要。另外,文章觸及使用AI工具提供的功能性應用,以及在創作和發展方面的潛力。
Thumbnail
人工智慧(AI)的發展日新月異,其中生成式AI成為近年矚目的焦點之一。生成式AI不僅能夠模仿人類智能,更能夠創造全新的內容和想法。本文將深入探討生成式AI在影像領域的應用,包括其概念、原理、發展趨勢,以及一些嶄新的生成式AI公司和軟體。
Thumbnail
ChatGPT 自2022年11月問世以降,開啟了生成式AI (Generative AI,也稱AIGC, AI Generated Content) 技術和應用的爆炸性發展。本篇文章提供了各種類型的AIGC工具整理,從個人助理到繪圖再到研究類一應俱全,幫助您提高生產力。
Thumbnail
AI生成式AI的出現,對人們的生活和工作帶來了變化。 在AI的輔助下,人們可以快速創作文稿和生成圖片,但這帶來了一個問題:生成的作品應該歸屬於誰?這將影響創作和娛樂產業。本文從立法歷程和產業影響的角度來探討這個議題,並分析賦予AI保護的利與弊。
Thumbnail
生成式AI的出現對作家產生了深遠的影響,改變了作家創作方式、市場生態和社會價值觀。未來可能出現市場壟斷、收入兩極分化、創作風格同質化等趨勢,也會引發政府幹預、創作市場的變革、社會運動與文化變革等事件。在這樣的環境中,作家需要不斷適應、創新,並挖掘新的市場需求。
Thumbnail
生成式AI(Generative AI)能夠創造新內容和想法,包括對話、故事、圖像、視訊和音樂等。本文將介紹幾種生成式AI模型,以及其在設計製造、教育、客戶服務、媒體與娛樂、市場營銷領域的應用和風險。然後就生成式AI的應用,設計製造、教育、客戶服務、媒體與娛樂、市場營銷等相關領域提供了一些示例。
在當今這個數字化時代,人工智慧的發展日新月異,AI聊天機器人逐漸成為人們生活中不可或缺的一部分。然而,隨著AI技術的不斷進步,人們不禁開始思考一個問題:真人會被AI取代嗎?這個問題引發了人們對於人工智慧與人類之間的比較和交互作用的深入探討。
Thumbnail
這篇文章整理了多種好用的AI工具,涵蓋了聲音與音樂相關的AI、影音、圖像生成編輯工具和AI搜尋引擎等領域,幫助你節省時間和解放創意與生產力。
Thumbnail
與其僅從應用面思考AI,不如瞭解其背後的原理。本文章探討生成式AI的發展及應用,包含使用AI生成文章、影片等的原理和技術。透過AI的世界原理記錄,可以達到應用無窮的效果。
Thumbnail
人工智慧生成內容(AIGC)的崛起,AI在文字、圖像、產品文案等方面的應用正掀起波瀾。本文分享了使用ChatGPT進行文案撰寫以及對於咒語格式與最佳內容認知的觀察。不過,使用者的專業程度對合作成果至關重要。另外,文章觸及使用AI工具提供的功能性應用,以及在創作和發展方面的潛力。
Thumbnail
人工智慧(AI)的發展日新月異,其中生成式AI成為近年矚目的焦點之一。生成式AI不僅能夠模仿人類智能,更能夠創造全新的內容和想法。本文將深入探討生成式AI在影像領域的應用,包括其概念、原理、發展趨勢,以及一些嶄新的生成式AI公司和軟體。
Thumbnail
ChatGPT 自2022年11月問世以降,開啟了生成式AI (Generative AI,也稱AIGC, AI Generated Content) 技術和應用的爆炸性發展。本篇文章提供了各種類型的AIGC工具整理,從個人助理到繪圖再到研究類一應俱全,幫助您提高生產力。
Thumbnail
AI生成式AI的出現,對人們的生活和工作帶來了變化。 在AI的輔助下,人們可以快速創作文稿和生成圖片,但這帶來了一個問題:生成的作品應該歸屬於誰?這將影響創作和娛樂產業。本文從立法歷程和產業影響的角度來探討這個議題,並分析賦予AI保護的利與弊。