AI朗讀或真人演播

更新於 發佈於 閱讀時間約 6 分鐘

說到AI朗讀,大家想到的是什麼?是google小姐的聲音?很機械音的冰冷感?如果是這樣那你一定沒有聽過好的AI朗讀!

因為最近一直在關注有聲書,AI朗讀有聲書已經發展多年,在演播人員哪裡找飯吃?一文中我故意漏掉了一點沒說,就是聲音授權研究和使用。大型的音頻平台在累積了大量的聲音庫之後,也同時做聲音的數據研究,AI的語音開發就是其中一種,目前在喜馬拉雅平台上,已經可以開放上傳一定節目量的用戶,有償授權聲音給喜馬拉雅使用,主要是授權給廣告主產生短視頻廣告播讀,聲音的主人在授權時可以選擇授權領域,例如,只授權給家具類、汽車類、教育類、零食類的廣告主使用。

而廣告主有需求時,可以在平台上挑選需要的聲音,輸入文稿,設定參數,然後就獲得了一條廣告語音了。

聲音的主人是採用分潤的方式,也就是獻聲後,有人用了,就在家躺賺就行。

如果大家刷抖音時,曾看到過那種「99包郵」、「點擊下方小黃車來上一單」的廣告,有不少都已經是AI生成的。

像這種採集聲音後,將文字轉語音TTS( text-to-speech)的還有一個常見的應用,就是汽車導航,或是汽車提示語音,例如:"請繫上安全帶、我們出發囉",像這類的試音單,在市面上看到的機會不少,一般會給個5、6句,事後他們怎麼用,我就不清楚了。

對我的收聽習慣來說,一個好的AI朗讀基礎要做好以下的學習:節奏、重音停連、抑揚頓挫。這個是一個「人」能表達出「講述感」很重要的基本原素,早期的AI朗讀為什麼會覺得機械,就是因為無法做好字與字間的快慢節奏、缺乏重音,連帶當然沒有抑揚頓挫。如果是要AI模仿人的音色,相對來說較為簡單,要能把AI調教成「這個人就像在你耳邊跟你說話」,那就高明了!

回到有聲書領域,建立在豐富的聲音資料庫基礎上,AI朗讀的有聲書已經可以做到接近「在你耳邊娓媚道來」的程度,在有聲書的開發上,除了直接用AI朗讀後再調校外,也有真人演播+AI朗讀共同合作的方式來製作。

AI朗讀能否取代真人演播,一直是中國有聲書演播圈一個時不時就會被提出的話題,老師們有時候也會恨鐵不成鋼地說出:「你再不把這個毛病改掉,你就會被AI取代了!」。不過為了提高製作效率,AI朗讀是一定會存在且被廣泛利用的,所以「演播員」和「AI朗讀」誰優誰劣也被拿出來比較,這大概就跟最近的AI畫圖和畫家的討論一樣。

真人演播與AI朗讀最大的差別就是「氣」,機器是沒有「氣」的,而在演播配音的訓練中,很重要的一環就是「氣的運用」,氣的使用可以在聽覺上建立這個人的真實感,引發聽眾的感受,例如,身而為人,我們會知道「這人講這話,是在諷刺吧」「可能要生氣了」「怎麼還在生氣」「這聽起來像是有什麼瞞著我」 ……目前我聽比較厲害的AI,會用弱化某個字來打造氣息的效果,也能做到接近真人。但如果這個是生成後手動調的……還要手動,那我就不叫它AI了。

我目前還沒聽到AI能好好模仿:清宮宮鬥戲中后妃們互相較勁的對白、「哥哥,你女朋友是不是在生氣」的綠茶、妖里妖氣的狐媚子……而人聲和氣聲混雜的發聲最多的,還屬謎片了!

我想這應該也是為什麼有些有聲書製作,會一部分AI、一部分真人了。

關於AI朗讀,推薦以已故評書大師單田芳老師聲音製作的相關有聲書。相關研究報導:http://tech.china.com.cn/roll/20210911/380715.shtml

今天寫這篇文章,是因為偶然看到天下雜誌「聽天下」這個計劃,推薦大家可以去聽一下 聽天下的AI朗讀 Sky錄製的文章朗讀。台灣現在的AI朗讀可以做到這個程度,拍手!GOOD JOB!!!

以下是AI開發訪談:https://open.firstory.me/story/cla38bg9d00qw010266ii8dsn

因為我比較關注有聲小說的發展,有很多有聲小說也都是用AI朗讀錄製,錄得好的,我大概要聽3分鐘以上才會覺得怪怪的,甚至用AI講評書都可以。已經可以幹掉一堆人了。

最後說說我覺得AI朗讀是否會取代真人演播,當然不可能。演播是一種藝術,每一個人讀到相同的文字,都會觸發自己記憶中的片段,引發心靈上不同的感受。在學演播的過程中,老師帶我們討論一篇故事文稿的「基調」的怎麼定時,老師要我們說出這篇故事要傳達什麼,結果每個同學出來的是「大同小異」,這個「小異」來自大家個人的感受,也將會在演播中,大大發展成「個人風格」。同樣一篇故事,有的同學可能感動得更多,帶入感多了,幾乎讀到泫然欲泣,這種用人意志來控制到底要維持專業不准哭、還是就只能忍一部分不哭出來,還是就哭了、小哭、爆哭就不是AI自己幹得出來的。而這個心理層面影響了演播的演繹,也會讓每個演播員在重點、停連有不同的表演方式,例如在演播一些動人或懸疑的段落人,演播員會用會「長長的留白」這種技巧,來堆積聽眾的感動或緊張,這種留白要留多長,也是取決於演播員自己對文稿的理解與藝術的表現。這種技巧,在音樂歌曲子,就是中間空個一小節,然後下一個小節又華麗出場這樣。

我希望台灣人工智慧實驗室(Taiwan AI Labs)明年可以計畫帶AI去參加全國語文朗讀比賽華文朗讀節。我真心的。

留言
avatar-img
留言分享你的想法!
avatar-img
憶裳思思的沙龍
47會員
109內容數
有聲書、有聲劇、廣播劇....有什麼差別?一本書化成有聲書的過程中,一個演播人員是如何參與其中?在版權的面前,是作者、愛好者、市場…共贏成長的鎧甲?還是揮向誰的武器?在這個行業中的每個角色,又能從中學到什麼……除了有聲書,演播人員還能參與到哪些作品中?本專題將由演播人員的視角出發,觀察有聲市場的變化與需求
憶裳思思的沙龍的其他內容
2022/12/19
網配圈在做什麼? "網配圈"是網絡配音圈的簡稱,也就是活躍於網路上的配音愛好者,除了喜歡各類配音作品外,也會組織小團隊創作完整劇作,大部分為非專職的興趣愛好者,也有部分人群是將之作為往專業方向的鍛鍊。 網配圈主要的創作類型為廣播劇、情感電台、有聲劇、有聲漫等。在中國有配音秀、戲鯨、麥萌這類的配音類a
Thumbnail
2022/12/19
網配圈在做什麼? "網配圈"是網絡配音圈的簡稱,也就是活躍於網路上的配音愛好者,除了喜歡各類配音作品外,也會組織小團隊創作完整劇作,大部分為非專職的興趣愛好者,也有部分人群是將之作為往專業方向的鍛鍊。 網配圈主要的創作類型為廣播劇、情感電台、有聲劇、有聲漫等。在中國有配音秀、戲鯨、麥萌這類的配音類a
Thumbnail
2022/12/03
這是一本博士論文,卻讓我讀得精神抖擻亢奮得睡不著覺。 作者:張毓如 博士 指導教授:范銘如 教授 國立政治大學/台灣文學研究所 (2018年出版) 閱讀連結:https://nccur.lib.nccu.edu.tw/bitstream/140.119/119041/1/950101.pdf 這是一
Thumbnail
2022/12/03
這是一本博士論文,卻讓我讀得精神抖擻亢奮得睡不著覺。 作者:張毓如 博士 指導教授:范銘如 教授 國立政治大學/台灣文學研究所 (2018年出版) 閱讀連結:https://nccur.lib.nccu.edu.tw/bitstream/140.119/119041/1/950101.pdf 這是一
Thumbnail
2022/12/02
在有聲演播培訓是割菜大現場中提到了很多人抱著「做副業」的心態學習演播,但不見得能達到被市場接受的水準。最近剛好拿到某個文娛集團合作的培訓單位開的課表,就貼上來分享一下。 課程規劃 我之前參加的培訓班也差不多是這樣一個節奏,有專業老師設計的課程,大概就是 第1個月:基礎咬字、發音、口腔控制、共鳴使用
Thumbnail
2022/12/02
在有聲演播培訓是割菜大現場中提到了很多人抱著「做副業」的心態學習演播,但不見得能達到被市場接受的水準。最近剛好拿到某個文娛集團合作的培訓單位開的課表,就貼上來分享一下。 課程規劃 我之前參加的培訓班也差不多是這樣一個節奏,有專業老師設計的課程,大概就是 第1個月:基礎咬字、發音、口腔控制、共鳴使用
Thumbnail
看更多
你可能也想看
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
據我所知,許多配音員老師是很反對去錄AI語音採樣的,但我則是抱持著不同的想法。昨天在九號群裡,和在線的伙伴們聊了一下我的想法,列出了很多應用場景,供大家自我判斷是否適合去錄AI語音採樣。 本篇內容是為剛從聲音培訓班結業、自我訓練一段時間、對聲音表演有興趣,但是不想成為配音員....等非職業配音員的
Thumbnail
據我所知,許多配音員老師是很反對去錄AI語音採樣的,但我則是抱持著不同的想法。昨天在九號群裡,和在線的伙伴們聊了一下我的想法,列出了很多應用場景,供大家自我判斷是否適合去錄AI語音採樣。 本篇內容是為剛從聲音培訓班結業、自我訓練一段時間、對聲音表演有興趣,但是不想成為配音員....等非職業配音員的
Thumbnail
Macbook的Siri聲音聽起來不錯,幫忙朗讀網頁原文文章吧! 朗讀中...~@3V#=%^$*> 怎麼朗讀的聲音這麼像機器人...(╯°Д°)╯︵ /(.□ . \)...啊 案例中,相信對於內建朗讀功能心灰意冷...ಠ_ಠ 開始在搜尋引擎或擴充功能搜尋欄中,輸入關鍵字“讀、...
Thumbnail
Macbook的Siri聲音聽起來不錯,幫忙朗讀網頁原文文章吧! 朗讀中...~@3V#=%^$*> 怎麼朗讀的聲音這麼像機器人...(╯°Д°)╯︵ /(.□ . \)...啊 案例中,相信對於內建朗讀功能心灰意冷...ಠ_ಠ 開始在搜尋引擎或擴充功能搜尋欄中,輸入關鍵字“讀、...
Thumbnail
聲音經濟 (Voice Economy) 是指以聲音為基礎的商業模式、技術與應用,用於創造價值和增加用戶體驗。藉由 AI改變聲音的創作、傳播與消費,將大幅改變人們與科技和品牌互動的方式。本文探討了AI世代包括虛擬語音助理、智慧音箱、文字生成語音和Podcast等不容忽視的市場數據和商業機會。
Thumbnail
聲音經濟 (Voice Economy) 是指以聲音為基礎的商業模式、技術與應用,用於創造價值和增加用戶體驗。藉由 AI改變聲音的創作、傳播與消費,將大幅改變人們與科技和品牌互動的方式。本文探討了AI世代包括虛擬語音助理、智慧音箱、文字生成語音和Podcast等不容忽視的市場數據和商業機會。
Thumbnail
Hi,大家好,我是茶桁。 其实到第18章的时候,我们处理文本的内容就全部都结束了,从本节课开始,我们要开始学习如何处理音频和图像。 我不知道有没有人和我一样的习性,就是比起视频和音频文件来说,还是跟喜欢看文本文件。这其中最主要的一个原因就是因为文本内容我们可以准确定位,而对于文本内容的接收速度还
Thumbnail
Hi,大家好,我是茶桁。 其实到第18章的时候,我们处理文本的内容就全部都结束了,从本节课开始,我们要开始学习如何处理音频和图像。 我不知道有没有人和我一样的习性,就是比起视频和音频文件来说,还是跟喜欢看文本文件。这其中最主要的一个原因就是因为文本内容我们可以准确定位,而对于文本内容的接收速度还
Thumbnail
多數人接收訊息、學習新知還是用「看」為主,但由於現今時間變得碎片化,不再像過往有完整的時間能夠集中專注在閱讀或學習一個主題,在這樣的趨勢下,我們的學習方式也必須隨之轉變,而這也是「聲音經濟」崛起的關鍵。 - 「聲音經濟」是什麼? - 為什麼用「聽」的學習方式會更快? - 一般人如何簡單運用 Cha
Thumbnail
多數人接收訊息、學習新知還是用「看」為主,但由於現今時間變得碎片化,不再像過往有完整的時間能夠集中專注在閱讀或學習一個主題,在這樣的趨勢下,我們的學習方式也必須隨之轉變,而這也是「聲音經濟」崛起的關鍵。 - 「聲音經濟」是什麼? - 為什麼用「聽」的學習方式會更快? - 一般人如何簡單運用 Cha
Thumbnail
調校電腦系統軟硬體,開啟 ChatGPT 的語音外掛,擴增 ChatGPT 的語音功能,升級進化 AI !!!
Thumbnail
調校電腦系統軟硬體,開啟 ChatGPT 的語音外掛,擴增 ChatGPT 的語音功能,升級進化 AI !!!
Thumbnail
文摘:我最近採用了新的寫作方式,利用AI將我錄製的播客內容轉換成文章形式。這個過程需要使用兩套AI程式,分別是雅婷語音轉逐字稿和ChatGPT。以往直接將語音轉換成逐字稿是不實用的,因為缺乏邏輯結構,需要耗費大量時間整理。但現在有了ChatGPT,它可以將逐字稿轉換成有邏輯結構的文章初稿,我再進行修
Thumbnail
文摘:我最近採用了新的寫作方式,利用AI將我錄製的播客內容轉換成文章形式。這個過程需要使用兩套AI程式,分別是雅婷語音轉逐字稿和ChatGPT。以往直接將語音轉換成逐字稿是不實用的,因為缺乏邏輯結構,需要耗費大量時間整理。但現在有了ChatGPT,它可以將逐字稿轉換成有邏輯結構的文章初稿,我再進行修
Thumbnail
你試用過人工智能(AI)文字轉語音功能了嗎? AI語音發展已經可高效地產出仿人聲語音,那麼,朗誦員、配音員的工作量是否會急遽減少呢? 現在爭議的問題點在於:業界人士發現有服務提供者混合市面上數種人聲錄音創造AI音頻,但沒有經過授權同意,侵害到原作者智慧財產權。 本篇文章介紹Google自動朗誦及AI
Thumbnail
你試用過人工智能(AI)文字轉語音功能了嗎? AI語音發展已經可高效地產出仿人聲語音,那麼,朗誦員、配音員的工作量是否會急遽減少呢? 現在爭議的問題點在於:業界人士發現有服務提供者混合市面上數種人聲錄音創造AI音頻,但沒有經過授權同意,侵害到原作者智慧財產權。 本篇文章介紹Google自動朗誦及AI
Thumbnail
在這個瞬息萬變的時代,數位行銷佔據著無比重要的地立。消費者如今更依賴網絡搜索、社交平台和手機應用程式。這樣的趨勢既為數位行銷帶來機遇,也帶來挑戰。要在這場競爭中脫穎而出,我們需要利用更加智能化的AI工具。
Thumbnail
在這個瞬息萬變的時代,數位行銷佔據著無比重要的地立。消費者如今更依賴網絡搜索、社交平台和手機應用程式。這樣的趨勢既為數位行銷帶來機遇,也帶來挑戰。要在這場競爭中脫穎而出,我們需要利用更加智能化的AI工具。
Thumbnail
連續經歷著智慧語音的科技、同事聊天的酣暢、研究文獻的晦澀,有滿滿的虛擬數位、真人對話、文字思緒之體驗感,且是在數位與真實間的連續擺盪。 最近讀了施登騰所寫的【博物館科技系列:如果博物館能說話?!(新增補版)】(https://reurl.cc/Y1zLxa),對於文中介紹能「正常」對話的「數位語音聊
Thumbnail
連續經歷著智慧語音的科技、同事聊天的酣暢、研究文獻的晦澀,有滿滿的虛擬數位、真人對話、文字思緒之體驗感,且是在數位與真實間的連續擺盪。 最近讀了施登騰所寫的【博物館科技系列:如果博物館能說話?!(新增補版)】(https://reurl.cc/Y1zLxa),對於文中介紹能「正常」對話的「數位語音聊
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News