AI朗讀或真人演播

更新於 2024/12/04發佈於 2022/12/05閱讀時間約 6 分鐘

說到AI朗讀，大家想到的是什麼？是google小姐的聲音？很機械音的冰冷感？如果是這樣那你一定沒有聽過好的AI朗讀！

因為最近一直在關注有聲書，AI朗讀有聲書已經發展多年，在演播人員哪裡找飯吃？一文中我故意漏掉了一點沒說，就是聲音授權研究和使用。大型的音頻平台在累積了大量的聲音庫之後，也同時做聲音的數據研究，AI的語音開發就是其中一種，目前在喜馬拉雅平台上，已經可以開放上傳一定節目量的用戶，有償授權聲音給喜馬拉雅使用，主要是授權給廣告主產生短視頻廣告播讀，聲音的主人在授權時可以選擇授權領域，例如，只授權給家具類、汽車類、教育類、零食類的廣告主使用。

而廣告主有需求時，可以在平台上挑選需要的聲音，輸入文稿，設定參數，然後就獲得了一條廣告語音了。

聲音的主人是採用分潤的方式，也就是獻聲後，有人用了，就在家躺賺就行。

如果大家刷抖音時，曾看到過那種「99包郵」、「點擊下方小黃車來上一單」的廣告，有不少都已經是AI生成的。

像這種採集聲音後，將文字轉語音TTS( text-to-speech)的還有一個常見的應用，就是汽車導航，或是汽車提示語音，例如："請繫上安全帶、我們出發囉"，像這類的試音單，在市面上看到的機會不少，一般會給個5、6句，事後他們怎麼用，我就不清楚了。

對我的收聽習慣來說，一個好的AI朗讀基礎要做好以下的學習：節奏、重音停連、抑揚頓挫。這個是一個「人」能表達出「講述感」很重要的基本原素，早期的AI朗讀為什麼會覺得機械，就是因為無法做好字與字間的快慢節奏、缺乏重音，連帶當然沒有抑揚頓挫。如果是要AI模仿人的音色，相對來說較為簡單，要能把AI調教成「這個人就像在你耳邊跟你說話」，那就高明了！

回到有聲書領域，建立在豐富的聲音資料庫基礎上，AI朗讀的有聲書已經可以做到接近「在你耳邊娓媚道來」的程度，在有聲書的開發上，除了直接用AI朗讀後再調校外，也有真人演播+AI朗讀共同合作的方式來製作。

AI朗讀能否取代真人演播，一直是中國有聲書演播圈一個時不時就會被提出的話題，老師們有時候也會恨鐵不成鋼地說出：「你再不把這個毛病改掉，你就會被AI取代了！」。不過為了提高製作效率，AI朗讀是一定會存在且被廣泛利用的，所以「演播員」和「AI朗讀」誰優誰劣也被拿出來比較，這大概就跟最近的AI畫圖和畫家的討論一樣。

真人演播與AI朗讀最大的差別就是「氣」，機器是沒有「氣」的，而在演播配音的訓練中，很重要的一環就是「氣的運用」，氣的使用可以在聽覺上建立這個人的真實感，引發聽眾的感受，例如，身而為人，我們會知道「這人講這話，是在諷刺吧」「可能要生氣了」「怎麼還在生氣」「這聽起來像是有什麼瞞著我」 ……目前我聽比較厲害的AI，會用弱化某個字來打造氣息的效果，也能做到接近真人。但如果這個是生成後手動調的……還要手動，那我就不叫它AI了。

我目前還沒聽到AI能好好模仿：清宮宮鬥戲中后妃們互相較勁的對白、「哥哥，你女朋友是不是在生氣」的綠茶、妖里妖氣的狐媚子……而人聲和氣聲混雜的發聲最多的，還屬謎片了！

我想這應該也是為什麼有些有聲書製作，會一部分AI、一部分真人了。

關於AI朗讀，推薦以已故評書大師單田芳老師聲音製作的相關有聲書。相關研究報導：http://tech.china.com.cn/roll/20210911/380715.shtml

今天寫這篇文章，是因為偶然看到天下雜誌「聽天下」這個計劃，推薦大家可以去聽一下聽天下的AI朗讀 Sky錄製的文章朗讀。台灣現在的AI朗讀可以做到這個程度，拍手！GOOD JOB!!!

以下是AI開發訪談：https://open.firstory.me/story/cla38bg9d00qw010266ii8dsn

因為我比較關注有聲小說的發展，有很多有聲小說也都是用AI朗讀錄製，錄得好的，我大概要聽3分鐘以上才會覺得怪怪的，甚至用AI講評書都可以。已經可以幹掉一堆人了。

最後說說我覺得AI朗讀是否會取代真人演播，當然不可能。演播是一種藝術，每一個人讀到相同的文字，都會觸發自己記憶中的片段，引發心靈上不同的感受。在學演播的過程中，老師帶我們討論一篇故事文稿的「基調」的怎麼定時，老師要我們說出這篇故事要傳達什麼，結果每個同學出來的是「大同小異」，這個「小異」來自大家個人的感受，也將會在演播中，大大發展成「個人風格」。同樣一篇故事，有的同學可能感動得更多，帶入感多了，幾乎讀到泫然欲泣，這種用人意志來控制到底要維持專業不准哭、還是就只能忍一部分不哭出來，還是就哭了、小哭、爆哭就不是AI自己幹得出來的。而這個心理層面影響了演播的演繹，也會讓每個演播員在重點、停連有不同的表演方式，例如在演播一些動人或懸疑的段落人，演播員會用會「長長的留白」這種技巧，來堆積聽眾的感動或緊張，這種留白要留多長，也是取決於演播員自己對文稿的理解與藝術的表現。這種技巧，在音樂歌曲子，就是中間空個一小節，然後下一個小節又華麗出場這樣。

我希望台灣人工智慧實驗室（Taiwan AI Labs）明年可以計畫帶AI去參加全國語文朗讀比賽和華文朗讀節。我真心的。

留言

留言分享你的想法！

憶裳思思的沙龍

53會員

111內容數

有聲書、有聲劇、廣播劇....有什麼差別？一本書化成有聲書的過程中，一個演播人員是如何參與其中？在版權的面前，是作者、愛好者、市場…共贏成長的鎧甲？還是揮向誰的武器？在這個行業中的每個角色，又能從中學到什麼……除了有聲書，演播人員還能參與到哪些作品中？本專題將由演播人員的視角出發，觀察有聲市場的變化與需求

憶裳思思的沙龍的其他內容

2022/12/19

"網配圈"

網配圈在做什麼？ "網配圈"是網絡配音圈的簡稱，也就是活躍於網路上的配音愛好者，除了喜歡各類配音作品外，也會組織小團隊創作完整劇作，大部分為非專職的興趣愛好者，也有部分人群是將之作為往專業方向的鍛鍊。網配圈主要的創作類型為廣播劇、情感電台、有聲劇、有聲漫等。在中國有配音秀、戲鯨、麥萌這類的配音類a

2022/12/19

"網配圈"

2022/12/03

拜讀: 《廣播小說：二十世紀中期台灣聽覺文化與聲音敘事》

這是一本博士論文，卻讓我讀得精神抖擻亢奮得睡不著覺。作者:張毓如博士指導教授:范銘如教授國立政治大學／台灣文學研究所 (2018年出版) 閱讀連結：https://nccur.lib.nccu.edu.tw/bitstream/140.119/119041/1/950101.pdf 這是一

2022/12/03

拜讀: 《廣播小說：二十世紀中期台灣聽覺文化與聲音敘事》

2022/12/02

演播培訓課表分享

在有聲演播培訓是割菜大現場中提到了很多人抱著「做副業」的心態學習演播，但不見得能達到被市場接受的水準。最近剛好拿到某個文娛集團合作的培訓單位開的課表，就貼上來分享一下。課程規劃我之前參加的培訓班也差不多是這樣一個節奏，有專業老師設計的課程，大概就是第1個月：基礎咬字、發音、口腔控制、共鳴使用

2022/12/02

你可能也想看

家中修繕或裝潢想要找各種小零件時，直接上網採買可以省去不少煩惱～看看Sylvia這回為了工地買了些什麼吧～

#開箱#蝦皮分潤計畫#裝修工程

2025/05/25

好好宅在家

設計師也蝦皮購－前陣子為工地買什麼？

家中修繕或裝潢想要找各種小零件時，直接上網採買可以省去不少煩惱～看看Sylvia這回為了工地買了些什麼吧～

#開箱#蝦皮分潤計畫#裝修工程

2025/05/25

Chloe小窩

我的簡單生活練習：三款包包與日常小物開箱分享

👜簡單生活，從整理包包開始！我的三款愛用包＋隨身小物清單開箱，一起來看看我每天都帶些什麼吧🌿✨

#蝦皮#開箱#蝦皮分潤計畫

2025/06/05

Chloe小窩

我的簡單生活練習：三款包包與日常小物開箱分享

👜簡單生活，從整理包包開始！我的三款愛用包＋隨身小物清單開箱，一起來看看我每天都帶些什麼吧🌿✨

#蝦皮#開箱#蝦皮分潤計畫

2025/06/05

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

創作者營運專員/經理（Operations Specialist/Manager）將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力，找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。

#vocus#方格子#求職

2025/06/23

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

#vocus#方格子#求職

2025/06/23

憶裳思思的沙龍

為什麼推薦你去錄AI語音採樣訓練

據我所知，許多配音員老師是很反對去錄AI語音採樣的，但我則是抱持著不同的想法。昨天在九號群裡，和在線的伙伴們聊了一下我的想法，列出了很多應用場景，供大家自我判斷是否適合去錄AI語音採樣。本篇內容是為剛從聲音培訓班結業、自我訓練一段時間、對聲音表演有興趣，但是不想成為配音員....等非職業配音員的

2024/04/12

2024/04/12

心情繪本｜文字朗讀｜MacBook講話不要含滷蛋

Macbook的Siri聲音聽起來不錯，幫忙朗讀網頁原文文章吧！朗讀中...～＠3V＃=％＾＄＊> 怎麼朗讀的聲音這麼像機器人...(╯°Д°）╯︵ /(.□ . \)...啊案例中，相信對於內建朗讀功能心灰意冷...ಠ_ಠ 開始在搜尋引擎或擴充功能搜尋欄中，輸入關鍵字“讀、...

#Macbook#speech#語音內容

2024/03/20

D&Y熊繪生的沙龍

心情繪本｜文字朗讀｜MacBook講話不要含滷蛋

#Macbook#speech#語音內容

2024/03/20

項博研究室

聲音經濟 (Voice Economy)：AI世代的商業革命

聲音經濟 (Voice Economy) 是指以聲音為基礎的商業模式、技術與應用，用於創造價值和增加用戶體驗。藉由 AI改變聲音的創作、傳播與消費，將大幅改變人們與科技和品牌互動的方式。本文探討了AI世代包括虛擬語音助理、智慧音箱、文字生成語音和Podcast等不容忽視的市場數據和商業機會。

#Podcast#智慧音箱#Spotify

2024/02/14

項博研究室

聲音經濟 (Voice Economy)：AI世代的商業革命

#Podcast#智慧音箱#Spotify

2024/02/14

茶桁的沙龍

19. 快速倾听和总结音频内容

Hi，大家好，我是茶桁。其实到第18章的时候，我们处理文本的内容就全部都结束了，从本节课开始，我们要开始学习如何处理音频和图像。我不知道有没有人和我一样的习性，就是比起视频和音频文件来说，还是跟喜欢看文本文件。这其中最主要的一个原因就是因为文本内容我们可以准确定位，而对于文本内容的接收速度还

2023/07/31

2023/07/31

GPT工作術｜與你一起補給工作的AI能量沙龍

用聽的學最快？三步驟把想學的內容變成 MP3 帶著走！

多數人接收訊息、學習新知還是用「看」為主，但由於現今時間變得碎片化，不再像過往有完整的時間能夠集中專注在閱讀或學習一個主題，在這樣的趨勢下，我們的學習方式也必須隨之轉變，而這也是「聲音經濟」崛起的關鍵。 - 「聲音經濟」是什麼？ - 為什麼用「聽」的學習方式會更快？ - 一般人如何簡單運用 Cha

#學習#語言#配音

2023/07/14

GPT工作術｜與你一起補給工作的AI能量沙龍

用聽的學最快？三步驟把想學的內容變成 MP3 帶著走！

#學習#語言#配音

2023/07/14

多語自學者

【AI＋語言學習】AI 與 AI 聯手，用 ChatGPT 練習４種英語口音及超過20個包含日韓等多國語言

調校電腦系統軟硬體，開啟 ChatGPT 的語音外掛，擴增 ChatGPT 的語音功能，升級進化 AI !!!

#語言學習#多語自學#AI

2023/06/27

多語自學者

【AI＋語言學習】AI 與 AI 聯手，用 ChatGPT 練習４種英語口音及超過20個包含日韓等多國語言

調校電腦系統軟硬體，開啟 ChatGPT 的語音外掛，擴增 ChatGPT 的語音功能，升級進化 AI !!!

#語言學習#多語自學#AI

2023/06/27

威利財經生活隨筆的沙龍

AI寫作革命：如何快速創作個人風格文章，傳遞你的靈魂

文摘:我最近採用了新的寫作方式，利用AI將我錄製的播客內容轉換成文章形式。這個過程需要使用兩套AI程式，分別是雅婷語音轉逐字稿和ChatGPT。以往直接將語音轉換成逐字稿是不實用的，因為缺乏邏輯結構，需要耗費大量時間整理。但現在有了ChatGPT，它可以將逐字稿轉換成有邏輯結構的文章初稿，我再進行修

#文章#ChatGPT#寫作

2023/06/21