中國AI語音有聲書《智能交通》聽後感

余孟珂

更新於 2023/05/27發佈於 2023/05/27閱讀時間約 3 分鐘

（本文前三段寫於2022年5月15日）

剛才聽了中國平臺運用AI技術製作的有聲書《智能交通》，作者是百度執行長李彥宏。這本書的主題是知識性、世界趨勢這類的題材。據製作團隊的說法，他們讓AI軟體蒐集了300句作者本人的講話聲音，就製作出這部我初步估算長達6到8小時的有聲書。

這種題材在口語上的演繹風格並不需要太過繁複、花俏；沉穩但偶有起伏的說話方式就已經非常適合。我認為在口語表現上，這已經是一部成熟的作品。（但在編排上還有精進的空間。）

可以想見，當語音AI技術更加開放、普及，某些主題的有聲書製作成本將大幅度地降低。而我相信這個時代並不遠了。

（以下文字寫於2022年5月19日）

來寫一點聽到現在的感想。

首先是技術面。在普通話的口語表現上，這本書已經幾乎是沒有破綻了。目前我大約聽了兩個多小時，僅有兩到三個字音、用語，疑似是編排失誤。要知道：你聽一場兩小時的現場演講，講者都不見得只有兩三個失誤讓你分神！唯一還聽得出破綻的，反而是一些英語縮寫，例如什麼TSSRVTEQWPGIH之類的東西（我聽過就忘了）。但整體說來，口語表現已是極度流暢！

其次是編輯面。就微觀的角度來說，文字書的編輯會需要留意字體、字距、行距、頁面邊距、章首插圖等等細節；同樣地，有聲書也會需要留意語速、句子之間的停頓、段落間的留白，以及章節首尾的設計。這本書的細節就做得不夠好。語速還ok，但是句間停頓太短，也幾乎沒有段落之分，聽起來稍嫌吃力。而且每個章節首尾都有「我是你的AI智能官，瑞萌」出來刷存在感，每一章的首尾各佔去15秒，相當於每一章都有30秒以上是沒有實質內容的。浪費我的時間，令人非常煩躁！

而就編輯面的宏觀角度來說，又分為「政治層次」與「內容層次」可談。這部作品在「政治層次」上，非常地「政治正確」！三不五時就要提一下「習主席」、「改革開放」、「共同富裕」、「十一五」，再順便宣揚一下政令與國家偉大理想。雖然煩躁，但尚可理解，也更新了我對中國文宣品的認識。閱聽者只要能自己過濾有政宣疑義的內容，這部份還不至於影響到我理解這本書的意旨。

而在內容上，我不確定這本書借用了多少前人的論述，但先假定這本書整合了各方論述好了。這本書的確清楚勾勒了一種令人恐懼（對於數位巨靈的恐懼）但又不禁讓我期待（因為確實點出了我實際上遇過的交通困擾）的交通遠景。但這部份有空再寫了。

留言

留言分享你的想法！

余孟珂的沙龍

3會員

13內容數

余孟珂的沙龍的其他內容

2023/06/13

談談有聲書《他們沒在寫小說的時候》的音樂製作

全書23個章節的開場與結尾插曲，雖然曲風各異，但全都是由《四季紅》、《月夜愁》、《望春風》、《雨夜花》四首歌曲的旋律片段發展而成。許多章節裡，樂曲的歌詞甚至暗示了那一章節的主角的心境。例如，在聶華苓無法跟安格爾遠走美國的這一篇裡，你會聽到木管與銅管彷彿彼此應和：「月色照在三線路，等待的人那袂來⋯⋯」

2023/06/13

談談有聲書《他們沒在寫小說的時候》的音樂製作

2023/06/04

聽《throughline》談信用分數的歷史

一個人的信用分數低，不是只有影響到他自己而已。信用分數低，利息就高；而當借貸者還不出錢，跟借貸者共享同一個標籤的整個群體，信用分數都會被評得更低。而有能力還錢的群體，分數則會越高。差距拉開差距，階級就這樣一直複製下去了。因此信用分數不只是在評定一個人的財務表現，而是整個社會的歧視的具象化。

2023/06/04

聽《throughline》談信用分數的歷史

2023/06/03

國人自製歌劇《天中殺》的音樂與語言

音樂本身也非常具有挑戰性。從系譜來說，這齣戲真的是歌劇，而非音樂劇。難得聽到有國內作曲家敢運用調式、非調音樂給戲劇歌手演唱，我給予作曲家最高的敬意。然而，這齣戲也重新讓我懷疑「台語歌詞是否適合以美聲唱法（bel canto）來演唱」這個老問題。

2023/06/03

國人自製歌劇《天中殺》的音樂與語言

看更多

你可能也想看

小愛和彤彤的小日常的沙龍

告別瞇眼寫功課！喜光TIONE⁺光健康智慧檯燈守護孩子視力

孩子寫功課時瞇眼？小心近視！這款喜光全光譜TIONE⁺光健康智慧檯燈，獲眼科院長推薦，網路好評不斷！全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉，讓孩子學習更舒適、保護眼睛！

#方格新手#保護眼睛#閱讀

2025/06/21

小愛和彤彤的小日常的沙龍

告別瞇眼寫功課！喜光TIONE⁺光健康智慧檯燈守護孩子視力

#方格新手#保護眼睛#閱讀

2025/06/21

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

創作者營運專員/經理（Operations Specialist/Manager）將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力，找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。

#vocus#方格子#求職

2025/06/23

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

#vocus#方格子#求職

2025/06/23

誰說編輯不讀書 | reading & ______

編輯聊新書：《權力與進步：科技變革與共享繁榮之間的千年辯證》

昨日才正式出版的新書《權力與進步：科技變革與共享繁榮之間的千年辯證》（Power and Progress），同時也是全球指定獨家中文版！作者直接放棄簡體版出版機會，就是因為不願意被審校書中一字一句內容......

#出版#閱讀#權力與進步

2023/12/01

誰說編輯不讀書 | reading & ______

編輯聊新書：《權力與進步：科技變革與共享繁榮之間的千年辯證》

#出版#閱讀#權力與進步

2023/12/01

Chudala的沙龍

文字的魔力

出版產業與實體書店低迷多年 11天前我企劃了這個題目當時我就知道自己真是不知天高地厚

#出版產業#專職主婦記者#專題報導

2023/11/07

Chudala的沙龍

文字的魔力

出版產業與實體書店低迷多年 11天前我企劃了這個題目當時我就知道自己真是不知天高地厚

#出版產業#專職主婦記者#專題報導

2023/11/07

韓知識

【新書讀後感】為你，千千萬萬遍

這次回台灣的時候，像往常一樣都會到誠品書局逛一逛，在新書專區一眼就能看見這本天空藍封面的小山，看到封面上寫著「翻譯筆記」，就不禁讓同是學翻譯的我引發一股好奇心，很想知道前輩走過來的心路里程，而且作者名字跟我一模一樣😆是另一個不假思索直接拿上收銀臺的原因。作者在後記寫著：那夜，站在書架前，看著這

2023/07/04

2023/07/04

AI語音能加速有聲書製作，但AI語音TTS仍無法取代有聲書

現在的有聲書製程，簡直堪比徒手抄書，技術基本上跟三十年前一樣，遲遲無法進入有聲書的活字印刷術時代。我自己是非常期待含有AI成份的TTS技術輔助有聲書的製作。然而，TTS功能與有聲書還是有著本質上的差異。

#有聲書#TTS#AI語音

2023/06/03

余孟珂的沙龍

AI語音能加速有聲書製作，但AI語音TTS仍無法取代有聲書

#有聲書#TTS#AI語音

2023/06/03

余孟珂的沙龍

AI語音TTS可以取代有聲書嗎？

對於拼音文字來說「我說即我寫」，但華「文」的方塊字卻不是如此，不僅同音字過多以致難以辨別（最簡單的例子是「他她牠它」），複雜歷史因素之下遺留在現代華「文」當中的文言文法（我寫非我說）也會造成聽覺理解障礙，種種因素都讓華文Text To華語Speech在短中期之內不可能完全取代華語有聲書。

2023/05/31

2023/05/31

這種題材在口語上的演繹風格並不需要太過繁複、花俏；沉穩但偶有起伏的說話方式就已經非常適合。我認為在口語表現上，這已經是一部成熟的作品；然而在編排上，這部作品還有很大的精步空間。閱聽者也需要自己用大腦過濾掉中國共產黨的政治宣傳。

2023/05/27

2023/05/27

GPT工作術｜與你一起補給工作的AI能量沙龍

文字MP3專業AI版：讓出版社更快速的製作高品質AI生成有聲書，滿足讀者的多元化知識吸收需求。

現今社會中，人們的時間與注意力被各種平台與媒體瓜分，所以越來越少人有時間閱讀書籍。即使時間變得更加有限，人們對知識的吸收依然保持著高度的興趣，經常透過 Youtube、Netflix、podcast、TikTok、Facebook、Instagram等各種多媒體平台進行學習。

#出版#出版社#有聲書

2023/04/27

GPT工作術｜與你一起補給工作的AI能量沙龍

文字MP3專業AI版：讓出版社更快速的製作高品質AI生成有聲書，滿足讀者的多元化知識吸收需求。

#出版#出版社#有聲書

2023/04/27

GPT工作術｜與你一起補給工作的AI能量沙龍

TTS文字轉語音再進化！【文字MP3專業版】AI有聲內容/有聲書創作工具

近來隨AI技術演進，網際智慧重新開發，推出「文字MP3專業版」，將應用層面擴大至有聲書、影片配音等，獲得2022年金塾獎新興技術組秀才。「文字MP3專業版」提供高品質真人發音引擎，可將大量文字内容轉換為朗讀聲音檔，並可在同一篇文字內容中切換不同朗讀聲音，並輸出為MP3或WAV聲音檔案。

#Podcast#TTS#文字轉語音

2023/02/01

GPT工作術｜與你一起補給工作的AI能量沙龍

TTS文字轉語音再進化！【文字MP3專業版】AI有聲內容/有聲書創作工具

#Podcast#TTS#文字轉語音

2023/02/01

憶裳思思的沙龍

AI朗讀或真人演播

說到AI朗讀，大家想到的是什麼？是google小姐的聲音？很機械音的冰冷感？如果是這樣那你一定沒有聽過好的AI朗讀！因為最近一直在關注有聲書，AI朗讀有聲書已經發展多年，在演播人員哪裡找飯吃？一文中我故意漏掉了一點沒說，就是聲音授權研究和使用。大型的音頻平台在累積了大量的聲音庫之後，也同時做聲音的

2022/12/05

2022/12/05

史塔克讀書會：AI 2041：預見10個未來新世界

今天跟大家推薦的這本書是：「AI 2041：預見10個未來新世界」這本書有趣的地方是雙作者，就像是OREO加上牛奶一切都不一樣了～原本可能讓人不好進入狀況的科普知識，透過一些小說的方式撰寫，其中的故事情節真的會讓人充滿想像。這偏稍微點幾個裡面講的東西，像是：史塔克實驗室官網:

2022/01/15

史塔克實驗室的沙龍

史塔克讀書會：AI 2041：預見10個未來新世界

2022/01/15

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News