AI朗讀或真人演播

閱讀時間約 5 分鐘
說到AI朗讀,大家想到的是什麼?是google小姐的聲音?很機械音的冰冷感?如果是這樣那你一定沒有聽過好的AI朗讀!
因為最近一直在關注有聲書,AI朗讀有聲書已經發展多年,在演播人員哪裡找飯吃?一文中我故意漏掉了一點沒說,就是聲音授權研究和使用。大型的音頻平台在累積了大量的聲音庫之後,也同時做聲音的數據研究,AI的語音開發就是其中一種,目前在喜馬拉雅平台上,已經可以開放上傳一定節目量的用戶,有償授權聲音給喜馬拉雅使用,主要是授權給廣告主產生短視頻廣告播讀,聲音的主人在授權時可以選擇授權領域,例如,只授權給家具類、汽車類、教育類、零食類的廣告主使用。
而廣告主有需求時,可以在平台上挑選需要的聲音,輸入文稿,設定參數,然後就獲得了一條廣告語音了。
聲音的主人是採用分潤的方式,也就是獻聲後,有人用了,就在家躺賺就行。
如果大家刷抖音時,曾看到過那種「99包郵」、「點擊下方小黃車來上一單」的廣告,有不少都已經是AI生成的。
像這種採集聲音後,將文字轉語音TTS( text-to-speech)的還有一個常見的應用,就是汽車導航,或是汽車提示語音,例如:"請繫上安全帶、我們出發囉",像這類的試音單,在市面上看到的機會不少,一般會給個5、6句,事後他們怎麼用,我就不清楚了。
對我的收聽習慣來說,一個好的AI朗讀基礎要做好以下的學習:節奏、重音停連、抑揚頓挫。這個是一個「人」能表達出「講述感」很重要的基本原素,早期的AI朗讀為什麼會覺得機械,就是因為無法做好字與字間的快慢節奏、缺乏重音,連帶當然沒有抑揚頓挫。如果是要AI模仿人的音色,相對來說較為簡單,要能把AI調教成「這個人就像在你耳邊跟你說話」,那就高明了!
回到有聲書領域,建立在豐富的聲音資料庫基礎上,AI朗讀的有聲書已經可以做到接近「在你耳邊娓媚道來」的程度,在有聲書的開發上,除了直接用AI朗讀後再調校外,也有真人演播+AI朗讀共同合作的方式來製作。
AI朗讀能否取代真人演播,一直是中國有聲書演播圈一個時不時就會被提出的話題,老師們有時候也會恨鐵不成鋼地說出:「你再不把這個毛病改掉,你就會被AI取代了!」。不過為了提高製作效率,AI朗讀是一定會存在且被廣泛利用的,所以「演播員」和「AI朗讀」誰優誰劣也被拿出來比較,這大概就跟最近的AI畫圖和畫家的討論一樣。
真人演播與AI朗讀最大的差別就是「氣」,機器是沒有「氣」的,而在演播配音的訓練中,很重要的一環就是「氣的運用」,氣的使用可以在聽覺上建立這個人的真實感,引發聽眾的感受,例如,身而為人,我們會知道「這人講這話,是在諷刺吧」「可能要生氣了」「怎麼還在生氣」「這聽起來像是有什麼瞞著我」 ……目前我聽比較厲害的AI,會用弱化某個字來打造氣息的效果,也能做到接近真人。但如果這個是生成後手動調的……還要手動,那我就不叫它AI了。
我目前還沒聽到AI能好好模仿:清宮宮鬥戲中后妃們互相較勁的對白、「哥哥,你女朋友是不是在生氣」的綠茶、妖里妖氣的狐媚子……而人聲和氣聲混雜的發聲最多的,還屬謎片了!
我想這應該也是為什麼有些有聲書製作,會一部分AI、一部分真人了。
關於AI朗讀,推薦以已故評書大師單田芳老師聲音製作的相關有聲書。相關研究報導:http://tech.china.com.cn/roll/20210911/380715.shtml
今天寫這篇文章,是因為偶然看到天下雜誌「聽天下」這個計劃,推薦大家可以去聽一下 聽天下的AI朗讀 Sky錄製的文章朗讀。台灣現在的AI朗讀可以做到這個程度,拍手!GOOD JOB!!!
因為我比較關注有聲小說的發展,有很多有聲小說也都是用AI朗讀錄製,錄得好的,我大概要聽3分鐘以上才會覺得怪怪的,甚至用AI講評書都可以。已經可以幹掉一堆人了。
最後說說我覺得AI朗讀是否會取代真人演播,當然不可能。演播是一種藝術,每一個人讀到相同的文字,都會觸發自己記憶中的片段,引發心靈上不同的感受。在學演播的過程中,老師帶我們討論一篇故事文稿的「基調」的怎麼定時,老師要我們說出這篇故事要傳達什麼,結果每個同學出來的是「大同小異」,這個「小異」來自大家個人的感受,也將會在演播中,大大發展成「個人風格」。同樣一篇故事,有的同學可能感動得更多,帶入感多了,幾乎讀到泫然欲泣,這種用人意志來控制到底要維持專業不准哭、還是就只能忍一部分不哭出來,還是就哭了、小哭、爆哭就不是AI自己幹得出來的。而這個心理層面影響了演播的演繹,也會讓每個演播員在重點、停連有不同的表演方式,例如在演播一些動人或懸疑的段落人,演播員會用會「長長的留白」這種技巧,來堆積聽眾的感動或緊張,這種留白要留多長,也是取決於演播員自己對文稿的理解與藝術的表現。這種技巧,在音樂歌曲子,就是中間空個一小節,然後下一個小節又華麗出場這樣。
我希望台灣人工智慧實驗室(Taiwan AI Labs)明年可以計畫帶AI去參加全國語文朗讀比賽華文朗讀節。我真心的。
為什麼會看到廣告
39會員
96Content count
有聲書、有聲劇、廣播劇....有什麼差別?一本書化成有聲書的過程中,一個演播人員是如何參與其中?在版權的面前,是作者、愛好者、市場…共贏成長的鎧甲?還是揮向誰的武器?在這個行業中的每個角色,又能從中學到什麼……除了有聲書,演播人員還能參與到哪些作品中?本專題將由演播人員的視角出發,觀察有聲市場的變化與需求
留言0
查看全部
發表第一個留言支持創作者!
憶裳思思的沙龍 的其他內容
這是一本博士論文,卻讓我讀得精神抖擻亢奮得睡不著覺。 作者:張毓如 博士 指導教授:范銘如 教授 國立政治大學/台灣文學研究所 (2018年出版) 閱讀連結:https://nccur.lib.nccu.edu.tw/bitstream/140.119/119041/1/950101.pdf 這是一
在有聲演播培訓是割菜大現場中提到了很多人抱著「做副業」的心態學習演播,但不見得能達到被市場接受的水準。最近剛好拿到某個文娛集團合作的培訓單位開的課表,就貼上來分享一下。 課程規劃 我之前參加的培訓班也差不多是這樣一個節奏,有專業老師設計的課程,大概就是 第1個月:基礎咬字、發音、口腔控制、共鳴使用
開始踏入有聲市場時時,常常看到這三個詞,有聲書、有聲劇、廣播劇,有什麼差別呢? 先說說有聲書,故名思義,就是一本「書」的聲音化作品,「書」指嚴格意義上有書號、有紙本印刷出版的實體。 有聲劇,以演員以旁白、獨白、對白、聲音來表演劇情的戲劇型式,搭配音樂、音效搭建場景。 廣播劇,嚴格意義來說,是在廣播電
/本文為podcast播講原稿,收聽對象為中國聽眾/ 歡迎收聽散文5分鐘,我是憶裳思思。結束了本季的播講,照例,來跟大家閒聊一個話題。前幾天在試音時,試到一個單子要求要用"台灣腔"來演播,我就想到在小紅書或抖音上有一些模仿台灣腔的教學,常常下面就會看到一片台灣人的留言說:台灣人講話才不是這樣子咧 也
一位演播員,每天一早起床,發出的第一個音是什麼呢?
市場一大,亂七八糟的人就多,在演播學習和修練路上,也遇過、見聞過一些騙人的把戲,就簡單分享一下。
這是一本博士論文,卻讓我讀得精神抖擻亢奮得睡不著覺。 作者:張毓如 博士 指導教授:范銘如 教授 國立政治大學/台灣文學研究所 (2018年出版) 閱讀連結:https://nccur.lib.nccu.edu.tw/bitstream/140.119/119041/1/950101.pdf 這是一
在有聲演播培訓是割菜大現場中提到了很多人抱著「做副業」的心態學習演播,但不見得能達到被市場接受的水準。最近剛好拿到某個文娛集團合作的培訓單位開的課表,就貼上來分享一下。 課程規劃 我之前參加的培訓班也差不多是這樣一個節奏,有專業老師設計的課程,大概就是 第1個月:基礎咬字、發音、口腔控制、共鳴使用
開始踏入有聲市場時時,常常看到這三個詞,有聲書、有聲劇、廣播劇,有什麼差別呢? 先說說有聲書,故名思義,就是一本「書」的聲音化作品,「書」指嚴格意義上有書號、有紙本印刷出版的實體。 有聲劇,以演員以旁白、獨白、對白、聲音來表演劇情的戲劇型式,搭配音樂、音效搭建場景。 廣播劇,嚴格意義來說,是在廣播電
/本文為podcast播講原稿,收聽對象為中國聽眾/ 歡迎收聽散文5分鐘,我是憶裳思思。結束了本季的播講,照例,來跟大家閒聊一個話題。前幾天在試音時,試到一個單子要求要用"台灣腔"來演播,我就想到在小紅書或抖音上有一些模仿台灣腔的教學,常常下面就會看到一片台灣人的留言說:台灣人講話才不是這樣子咧 也
一位演播員,每天一早起床,發出的第一個音是什麼呢?
市場一大,亂七八糟的人就多,在演播學習和修練路上,也遇過、見聞過一些騙人的把戲,就簡單分享一下。
你可能也想看
Thumbnail
1.加權指數與櫃買指數 週五的加權指數在非農就業數據開出來後,雖稍微低於預期,但指數仍向上噴出,在美股開盤後於21500形成一個爆量假突破後急轉直下,就一路收至最低。 台股方面走勢需觀察週一在斷頭潮出現後,週二或週三開始有無買單進場支撐,在沒有明確的反轉訊號形成前,小夥伴盡量不要貿然抄底,或是追空
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
本片原文:已經在留日,卻回頭參加台灣的線上日語課程:台灣日語教學的獨特魅力 https://youtu.be/SJCsMZNvk74?si=VrQWTnhP-4AxlxRI
Thumbnail
本片原文:青春日語夢與覺醒:台灣留日學生在日本語言學校的奮戰與覺醒 https://vocus.cc/article/656e806ffd89780001acff56
Thumbnail
本片原文:17歲台灣少年日語全球第一!無留日經驗考生的奇蹟 https://vocus.cc/article/65670d56fd8978000102c3ff
Thumbnail
本片原文:本片原文:61歲,嘗試多種傳統教學,仍學不會的日語,在吳氏日體驗到奇蹟! https://vocus.cc/article/6565891afd8978000156b29e
Thumbnail
本片原文:61歲,嘗試多種傳統教學,仍學不會的日語,在吳氏日體驗到奇蹟! https://vocus.cc/article/656587e0fd8978000156a217
Thumbnail
新冠肺炎疫情,無疑是場改變全球的大事件。在尚稱能妥善控制疫情的臺灣,也不免在各方各面受到影響,而在疫情激烈爆發的日本,更導致了日本人民對政府的不滿,以及對政治的冷漠。有鑑於此,本書作者真邊明人,創造了一個平行時空——如果讓日本古往今來的英雄豪傑們,面對此次新冠疫情,會是如何呢?
●深度造假是一種「合成媒體」(synthetic media,又譯「合成內容」),代表媒體內容(包括圖片、影像和聲音)受到操控,或完全由人工智慧創造。AI技術讓媒體控制變得更輕鬆,也更容易了(例如Photoshop或Instagram的濾鏡功能)。
Thumbnail
你有沒有想過,那些所謂的職場菁英在工作上與自己有什麼區別?在這篇文章中,我將這本書的內容歸納出兩個部分:職場菁英的五個工作習慣、九個思考觀點。在文章的最後也會附上一張全息圖,讓你一次掌握職場菁英工作術的重點。
Thumbnail
投稿人:杜聿鎧 /投稿類型:文學創作 阮感覺誠歹勢 恬恬仔沒法度放過 Gún kám-kak chiân pháin-sè. Tiām-tiām-á bô hoat-tō͘ pàng-kòe. 時間總是按呢 慢慢仔越看越淡个 Sî-kan chóng-sī án-ne. Bān-bān-á lú
Thumbnail
1.加權指數與櫃買指數 週五的加權指數在非農就業數據開出來後,雖稍微低於預期,但指數仍向上噴出,在美股開盤後於21500形成一個爆量假突破後急轉直下,就一路收至最低。 台股方面走勢需觀察週一在斷頭潮出現後,週二或週三開始有無買單進場支撐,在沒有明確的反轉訊號形成前,小夥伴盡量不要貿然抄底,或是追空
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
本片原文:已經在留日,卻回頭參加台灣的線上日語課程:台灣日語教學的獨特魅力 https://youtu.be/SJCsMZNvk74?si=VrQWTnhP-4AxlxRI
Thumbnail
本片原文:青春日語夢與覺醒:台灣留日學生在日本語言學校的奮戰與覺醒 https://vocus.cc/article/656e806ffd89780001acff56
Thumbnail
本片原文:17歲台灣少年日語全球第一!無留日經驗考生的奇蹟 https://vocus.cc/article/65670d56fd8978000102c3ff
Thumbnail
本片原文:本片原文:61歲,嘗試多種傳統教學,仍學不會的日語,在吳氏日體驗到奇蹟! https://vocus.cc/article/6565891afd8978000156b29e
Thumbnail
本片原文:61歲,嘗試多種傳統教學,仍學不會的日語,在吳氏日體驗到奇蹟! https://vocus.cc/article/656587e0fd8978000156a217
Thumbnail
新冠肺炎疫情,無疑是場改變全球的大事件。在尚稱能妥善控制疫情的臺灣,也不免在各方各面受到影響,而在疫情激烈爆發的日本,更導致了日本人民對政府的不滿,以及對政治的冷漠。有鑑於此,本書作者真邊明人,創造了一個平行時空——如果讓日本古往今來的英雄豪傑們,面對此次新冠疫情,會是如何呢?
●深度造假是一種「合成媒體」(synthetic media,又譯「合成內容」),代表媒體內容(包括圖片、影像和聲音)受到操控,或完全由人工智慧創造。AI技術讓媒體控制變得更輕鬆,也更容易了(例如Photoshop或Instagram的濾鏡功能)。
Thumbnail
你有沒有想過,那些所謂的職場菁英在工作上與自己有什麼區別?在這篇文章中,我將這本書的內容歸納出兩個部分:職場菁英的五個工作習慣、九個思考觀點。在文章的最後也會附上一張全息圖,讓你一次掌握職場菁英工作術的重點。
Thumbnail
投稿人:杜聿鎧 /投稿類型:文學創作 阮感覺誠歹勢 恬恬仔沒法度放過 Gún kám-kak chiân pháin-sè. Tiām-tiām-á bô hoat-tō͘ pàng-kòe. 時間總是按呢 慢慢仔越看越淡个 Sî-kan chóng-sī án-ne. Bān-bān-á lú