中國AI語音有聲書《智能交通》聽後感

更新於 發佈於 閱讀時間約 3 分鐘

(本文前三段寫於2022年5月15日)

剛才聽了中國平臺運用AI技術製作的有聲書《智能交通》,作者是百度執行長李彥宏。這本書的主題是知識性、世界趨勢這類的題材。據製作團隊的說法,他們讓AI軟體蒐集了300句作者本人的講話聲音,就製作出這部我初步估算長達6到8小時的有聲書。

這種題材在口語上的演繹風格並不需要太過繁複、花俏;沉穩但偶有起伏的說話方式就已經非常適合。我認為在口語表現上,這已經是一部成熟的作品。(但在編排上還有精進的空間。)

可以想見,當語音AI技術更加開放、普及,某些主題的有聲書製作成本將大幅度地降低。而我相信這個時代並不遠了。

(以下文字寫於2022年5月19日)

來寫一點聽到現在的感想。

首先是技術面。在普通話的口語表現上,這本書已經幾乎是沒有破綻了。目前我大約聽了兩個多小時,僅有兩到三個字音、用語,疑似是編排失誤。要知道:你聽一場兩小時的現場演講,講者都不見得只有兩三個失誤讓你分神!唯一還聽得出破綻的,反而是一些英語縮寫,例如什麼TSSRVTEQWPGIH之類的東西(我聽過就忘了)。但整體說來,口語表現已是極度流暢!

其次是編輯面。就微觀的角度來說,文字書的編輯會需要留意字體、字距、行距、頁面邊距、章首插圖等等細節;同樣地,有聲書也會需要留意語速、句子之間的停頓、段落間的留白,以及章節首尾的設計。這本書的細節就做得不夠好。語速還ok,但是句間停頓太短,也幾乎沒有段落之分,聽起來稍嫌吃力。而且每個章節首尾都有「我是你的AI智能官,瑞萌」出來刷存在感,每一章的首尾各佔去15秒,相當於每一章都有30秒以上是沒有實質內容的。浪費我的時間,令人非常煩躁!

而就編輯面的宏觀角度來說,又分為「政治層次」與「內容層次」可談。這部作品在「政治層次」上,非常地「政治正確」!三不五時就要提一下「習主席」、「改革開放」、「共同富裕」、「十一五」,再順便宣揚一下政令與國家偉大理想。雖然煩躁,但尚可理解,也更新了我對中國文宣品的認識。閱聽者只要能自己過濾有政宣疑義的內容,這部份還不至於影響到我理解這本書的意旨。

而在內容上,我不確定這本書借用了多少前人的論述,但先假定這本書整合了各方論述好了。這本書的確清楚勾勒了一種令人恐懼(對於數位巨靈的恐懼)但又不禁讓我期待(因為確實點出了我實際上遇過的交通困擾)的交通遠景。但這部份有空再寫了。

留言
avatar-img
留言分享你的想法!
avatar-img
余孟珂的沙龍
3會員
13內容數
余孟珂的沙龍的其他內容
2023/06/13
全書23個章節的開場與結尾插曲,雖然曲風各異,但全都是由《四季紅》、《月夜愁》、《望春風》、《雨夜花》四首歌曲的旋律片段發展而成。許多章節裡,樂曲的歌詞甚至暗示了那一章節的主角的心境。例如,在聶華苓無法跟安格爾遠走美國的這一篇裡,你會聽到木管與銅管彷彿彼此應和:「月色照在三線路,等待的人那袂來⋯⋯」
Thumbnail
2023/06/13
全書23個章節的開場與結尾插曲,雖然曲風各異,但全都是由《四季紅》、《月夜愁》、《望春風》、《雨夜花》四首歌曲的旋律片段發展而成。許多章節裡,樂曲的歌詞甚至暗示了那一章節的主角的心境。例如,在聶華苓無法跟安格爾遠走美國的這一篇裡,你會聽到木管與銅管彷彿彼此應和:「月色照在三線路,等待的人那袂來⋯⋯」
Thumbnail
2023/06/04
一個人的信用分數低,不是只有影響到他自己而已。信用分數低,利息就高;而當借貸者還不出錢,跟借貸者共享同一個標籤的整個群體,信用分數都會被評得更低。而有能力還錢的群體,分數則會越高。差距拉開差距,階級就這樣一直複製下去了。因此信用分數不只是在評定一個人的財務表現,而是整個社會的歧視的具象化。
Thumbnail
2023/06/04
一個人的信用分數低,不是只有影響到他自己而已。信用分數低,利息就高;而當借貸者還不出錢,跟借貸者共享同一個標籤的整個群體,信用分數都會被評得更低。而有能力還錢的群體,分數則會越高。差距拉開差距,階級就這樣一直複製下去了。因此信用分數不只是在評定一個人的財務表現,而是整個社會的歧視的具象化。
Thumbnail
2023/06/03
音樂本身也非常具有挑戰性。從系譜來說,這齣戲真的是歌劇,而非音樂劇。難得聽到有國內作曲家敢運用調式、非調音樂給戲劇歌手演唱,我給予作曲家最高的敬意。 然而,這齣戲也重新讓我懷疑「台語歌詞是否適合以美聲唱法(bel canto)來演唱」這個老問題。
Thumbnail
2023/06/03
音樂本身也非常具有挑戰性。從系譜來說,這齣戲真的是歌劇,而非音樂劇。難得聽到有國內作曲家敢運用調式、非調音樂給戲劇歌手演唱,我給予作曲家最高的敬意。 然而,這齣戲也重新讓我懷疑「台語歌詞是否適合以美聲唱法(bel canto)來演唱」這個老問題。
Thumbnail
看更多
你可能也想看
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
昨日才正式出版的新書《權力與進步:科技變革與共享繁榮之間的千年辯證》(Power and Progress),同時也是全球指定獨家中文版!作者直接放棄簡體版出版機會,就是因為不願意被審校書中一字一句內容......
Thumbnail
昨日才正式出版的新書《權力與進步:科技變革與共享繁榮之間的千年辯證》(Power and Progress),同時也是全球指定獨家中文版!作者直接放棄簡體版出版機會,就是因為不願意被審校書中一字一句內容......
Thumbnail
出版產業與實體書店低迷多年 11天前我企劃了這個題目 當時我就知道 自己真是不知天高地厚
Thumbnail
出版產業與實體書店低迷多年 11天前我企劃了這個題目 當時我就知道 自己真是不知天高地厚
Thumbnail
這次回台灣的時候,像往常一樣都會到誠品書局逛一逛,在新書專區一眼就能看見這本天空藍封面的小山,看到封面上寫著「翻譯筆記」,就不禁讓同是學翻譯的我引發一股好奇心,很想知道前輩走過來的心路里程,而且作者名字跟我一模一樣😆是另一個不假思索直接拿上收銀臺的原因。 作者在後記寫著: 那夜,站在書架前,看著這
Thumbnail
這次回台灣的時候,像往常一樣都會到誠品書局逛一逛,在新書專區一眼就能看見這本天空藍封面的小山,看到封面上寫著「翻譯筆記」,就不禁讓同是學翻譯的我引發一股好奇心,很想知道前輩走過來的心路里程,而且作者名字跟我一模一樣😆是另一個不假思索直接拿上收銀臺的原因。 作者在後記寫著: 那夜,站在書架前,看著這
Thumbnail
現在的有聲書製程,簡直堪比徒手抄書,技術基本上跟三十年前一樣,遲遲無法進入有聲書的活字印刷術時代。我自己是非常期待含有AI成份的TTS技術輔助有聲書的製作。然而,TTS功能與有聲書還是有著本質上的差異。
Thumbnail
現在的有聲書製程,簡直堪比徒手抄書,技術基本上跟三十年前一樣,遲遲無法進入有聲書的活字印刷術時代。我自己是非常期待含有AI成份的TTS技術輔助有聲書的製作。然而,TTS功能與有聲書還是有著本質上的差異。
Thumbnail
對於拼音文字來說「我說即我寫」,但華「文」的方塊字卻不是如此,不僅同音字過多以致難以辨別(最簡單的例子是「他她牠它」),複雜歷史因素之下遺留在現代華「文」當中的文言文法(我寫非我說)也會造成聽覺理解障礙,種種因素都讓華文Text To華語Speech在短中期之內不可能完全取代華語有聲書。
Thumbnail
對於拼音文字來說「我說即我寫」,但華「文」的方塊字卻不是如此,不僅同音字過多以致難以辨別(最簡單的例子是「他她牠它」),複雜歷史因素之下遺留在現代華「文」當中的文言文法(我寫非我說)也會造成聽覺理解障礙,種種因素都讓華文Text To華語Speech在短中期之內不可能完全取代華語有聲書。
Thumbnail
這種題材在口語上的演繹風格並不需要太過繁複、花俏;沉穩但偶有起伏的說話方式就已經非常適合。我認為在口語表現上,這已經是一部成熟的作品;然而在編排上,這部作品還有很大的精步空間。閱聽者也需要自己用大腦過濾掉中國共產黨的政治宣傳。
Thumbnail
這種題材在口語上的演繹風格並不需要太過繁複、花俏;沉穩但偶有起伏的說話方式就已經非常適合。我認為在口語表現上,這已經是一部成熟的作品;然而在編排上,這部作品還有很大的精步空間。閱聽者也需要自己用大腦過濾掉中國共產黨的政治宣傳。
Thumbnail
現今社會中,人們的時間與注意力被各種平台與媒體瓜分,所以越來越少人有時間閱讀書籍。即使時間變得更加有限,人們對知識的吸收依然保持著高度的興趣,經常透過 Youtube、Netflix、podcast、TikTok、Facebook、Instagram等各種多媒體平台進行學習。
Thumbnail
現今社會中,人們的時間與注意力被各種平台與媒體瓜分,所以越來越少人有時間閱讀書籍。即使時間變得更加有限,人們對知識的吸收依然保持著高度的興趣,經常透過 Youtube、Netflix、podcast、TikTok、Facebook、Instagram等各種多媒體平台進行學習。
Thumbnail
近來隨AI技術演進,網際智慧重新開發,推出「文字MP3專業版」,將應用層面擴大至有聲書、影片配音等,獲得2022年金塾獎新興技術組秀才。「文字MP3專業版」提供高品質真人發音引擎,可將大量文字内容轉換為朗讀聲音檔,並可在同一篇文字內容中切換不同朗讀聲音,並輸出為MP3或WAV聲音檔案。
Thumbnail
近來隨AI技術演進,網際智慧重新開發,推出「文字MP3專業版」,將應用層面擴大至有聲書、影片配音等,獲得2022年金塾獎新興技術組秀才。「文字MP3專業版」提供高品質真人發音引擎,可將大量文字内容轉換為朗讀聲音檔,並可在同一篇文字內容中切換不同朗讀聲音,並輸出為MP3或WAV聲音檔案。
Thumbnail
說到AI朗讀,大家想到的是什麼?是google小姐的聲音?很機械音的冰冷感?如果是這樣那你一定沒有聽過好的AI朗讀! 因為最近一直在關注有聲書,AI朗讀有聲書已經發展多年,在演播人員哪裡找飯吃?一文中我故意漏掉了一點沒說,就是聲音授權研究和使用。大型的音頻平台在累積了大量的聲音庫之後,也同時做聲音的
Thumbnail
說到AI朗讀,大家想到的是什麼?是google小姐的聲音?很機械音的冰冷感?如果是這樣那你一定沒有聽過好的AI朗讀! 因為最近一直在關注有聲書,AI朗讀有聲書已經發展多年,在演播人員哪裡找飯吃?一文中我故意漏掉了一點沒說,就是聲音授權研究和使用。大型的音頻平台在累積了大量的聲音庫之後,也同時做聲音的
Thumbnail
今天跟大家推薦的這本書是:「AI 2041:預見10個未來新世界」 這本書有趣的地方是雙作者,就像是OREO加上牛奶 一切都不一樣了~原本可能讓人不好進入狀況的科普知識,透過一些小說的方式撰寫,其中的故事情節真的會讓人充滿想像。 這偏稍微點幾個裡面講的東西,像是: 史塔克實驗室官網:
Thumbnail
今天跟大家推薦的這本書是:「AI 2041:預見10個未來新世界」 這本書有趣的地方是雙作者,就像是OREO加上牛奶 一切都不一樣了~原本可能讓人不好進入狀況的科普知識,透過一些小說的方式撰寫,其中的故事情節真的會讓人充滿想像。 這偏稍微點幾個裡面講的東西,像是: 史塔克實驗室官網:
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News