聲音經濟 (Voice Economy):AI世代的商業革命

閱讀時間約 8 分鐘

聲音經濟 (Voice Economy) 是指以聲音為基礎的商業模式、技術與應用,用於創造價值和增加用戶體驗,舉凡音樂數位下載、串流媒體、電話行銷/客服、語音導覽、廣播/有聲書/Podcast...等皆代表一定規模的市場價值 。如今在AI浪潮席捲下,藉由AI改變聲音的創作、傳播與消費而將聲音轉換為商業價值和新機會,已掀起另一波商業革命,筆者預期將大幅改變我們與科技和品牌互動的方式。

raw-image

幾個不容忽視的數據

  • 超過三分之一的美國家庭擁有智慧音箱1
  • 台灣每5人就有1人收聽Podcast1
  • 2021年Podcast廣告年收益已超過10億美元1
  • Spotify美國Podcast聽眾人數在2023年將成長至3,750萬人1
  • 58%美國消費者表示會使用聲控技術,因為對某些任務來說更容易、方便2
  • 46%美國消費者認為,語音助理將在不到五年內像人類一樣聰明、可靠2
  • 28%美國消費者願意為語音助理服務付費2

(參考來源:1. 聲音經濟:從語音助理、Podcast到智慧音箱,科技巨頭爭相搶進的新市場 2. How Consumers Want to Live in the Voice Economy | PYMNTS)

聲音經濟的興起

聲音經濟之興起從聲音數位化 (Digitalization) 帶動聲音科技進步開始。當類比 (Analog) 訊號走入歷史,數位時代無論聲音之品質、傳遞及保存方式,皆克服了過往類比時代的種種不便及限制。隨後因網路科技蓬勃發展,伴隨各類型裝置 (如MP3、iPod、智慧型手機、平板等)、媒體平台 (例如串流影音) 的問世,造就消費者習慣改變而衍生出許多不同的商業需求,例如音樂數位下載、線上收聽、語音導覽/客服、Podcast等。近幾年Covid-19的肆虐衝擊,更促進了非接觸式聲音經濟的蓬勃發展。

進入AI時代後,由於自然語音處理 (NLP, Neuro-Linguistic Programming)、機器學習 (ML, Machine Learning)、大型語言模型 (LLM, Large Language Models) 和語音識別 (ASR, Automatic Speech Recognition) 等技術日益成熟,聲音科技在商業模式上的應用逐漸邁入新的紀元。從以下研究整理,可以顯見AI世代聲音經濟的龐大商機。

虛擬語音助理 (Virtual Assistant)

虛擬助理 (Virtual Assistant) 是一種基於AI科技實現理解使用者輸入之命令或問題並提供回應 (包含回答或執行任務) 之技術,可透過文字、圖形介面或語音 (通常結合聊天機器人功能來模擬人類對話) 等方式與用戶互動。在科技大廠的帶動下,AI語音助理已大量應用在各類型智慧型裝置上,較知名者包括蘋果的Siri、亞馬遜Alexa、Google Assistant和三星的Bixby;而各行業公司也經常將某種虛擬助理技術納入其客戶服務或支援之中。(參考來源:Virtual assistant | 維基百科)

據IMIR研究分析師表示,2021年全球AI語音助理市場規模為29億美元,預計到2028年將達到150億美元,2021年至2028年複合年增長率為28%。(參考來源:Global Voice Assistant Market Research Report | IMIR)

智慧音箱 (Smart Speaker)

智慧音箱 (Smart Speaker) 是一種無線智慧家居音訊設備,可透過語音命令啟動聽音樂、訂餐、線上購物等,並使用多種連接類型來提供環控、保全等附加功能。根據Verified Market Research研究報告,2021年智慧音箱市場規模為80.2億美元,預計到2030年將達到320.5億美元,2022年至2030年複合年增長率為16.65%。(參考來源:Smart Speaker Market Size And Forecast | VMR)

根據Statista Consumer Insights 2022年美國智慧音箱市佔率調查結果,美國智慧音箱用戶中有67%擁有Amazon Echo,Google Home及其繼任產品Google Nest受歡迎程度排名第二 (27%) 和第四 (18%) ,21%家中擁有HomePod,而Sony亦躋身前五名。(參考來源:Amazon Dominates the U.S. Smart Speaker Market | statista)

AI文字生成語音 (TTS, Text-to-Speech)

在眾多生成式AI當中,AI文字生成語音 (TTS, Text-to-Speech) 是一種透過AI將文字腳本轉換為人類自然語音的人工智慧技術,可用於產生電影、廣告、遊戲和其他用途的人聲而大幅減少錄製真實語音的時間及成本。據market.us估計至2032年,AI語音生成市場規模將達到49億美元,年複合成長率15.40%。潛力市場涵蓋醫療保健、銀行/金融服務/保險、製造、廣告和媒體及其他最終用途行業,並應用於包括聊天機器人、虛擬助理和語音設備等。(參考來源:AI Voice Generator Market Research | market.us

語音辨識和語音合成是長久以來人工智慧技術發展的重點,其語音呈現的擬真與自然程度足以反映AI科技成熟度。在Google、微軟、蘋果等科技先驅引領下,現今AI生成語音已進入百家爭鳴,除了跨越多國語言藩籬,其自然度也多能貼近真實人聲。例如筆者任職公司所推出的TTS服務 - ATEN優聲學,便是其中標榜在地化純正台灣口音、有溫度的擬真AI voice而獨樹一格。

Podcast

近年來,憑藉媒體生態與消費習慣轉變、無線耳機普及和Apple Podcast和Spotify等串流平台的全力支持,Podcast從小眾自媒體搖身一變成了各界搶進的新興主流媒體。根據IAB和PWC分析,2025年美國Podcast廣告收入估計將成長一倍以上,達到40億美元左右。(參考來源:U.S Podcast Advertising Revenue Study 2023 | IAB and PWC)

台灣Podcast的興起雖起步較晚,然據SoundOn聲浪發表之報告,2022年台灣Podcast商案合作市值估計近10億元,使得2022年被譽為台灣聲音變現元年,未來成長潛力可期。(參考來源:2022年度聲音經濟報告書 | SoundOn)

而AI也可說是Podcast興盛的幕後推手之一,例如Spotify串流媒體平台創立以來在市場獲得無比成功,總市值達到470億美元 (參考來源:Google Finance 2024-2-15收盤),背後即是基於強大的深度學習技術改善其個人化及推薦功能。此外,Spotify於2023-9-25發表podcast語音翻譯試播功能 (Voice Translation for podcast),這是一項由AI提供支援的突破性技術,可將podcast翻譯成其他語言 (包括西班牙語、法語和德語),驚人的是,全部以podcasters的原音呈現。相信讀者不難想像,在此項技術更為成熟之後,將大幅造就Podcast另一波全球影響力。(參考來源:Voice Translation on Spotify)

聲音經濟的未來

從以上產業趨勢可知,聲音經濟在科技持續進化和AI的推波助瀾之下,勢將衍生更多創新、便利和個人化應用,而產生極大的商業模式創新和創業機會。然而AI隱含的法律、隱私、倫理和安全性議題仍有待時間考驗與秩序調合,而多國語系與自然發音的隔閡也挑戰語音科技的後續發展,這一切都值得我們更多的資源投入與密切關注。

2會員
2內容數
臺灣科技大學管研所博士候選人 / 任職跨國科技業總經理室 - 關注科技應用、體驗行銷、卓越商業促進等專業領域,拿過論文獎、個案競賽冠軍,籌辦過國際會議、慈善音樂會等大小活動,熱愛探索新知並重視生活的雙子大叔。
留言0
查看全部
發表第一個留言支持創作者!
項博研究室 的其他內容
ChatGPT 自2022年11月問世以降,開啟了生成式AI (Generative AI,也稱AIGC, AI Generated Content) 技術和應用的爆炸性發展。本篇文章提供了各種類型的AIGC工具整理,從個人助理到繪圖再到研究類一應俱全,幫助您提高生產力。
ChatGPT 自2022年11月問世以降,開啟了生成式AI (Generative AI,也稱AIGC, AI Generated Content) 技術和應用的爆炸性發展。本篇文章提供了各種類型的AIGC工具整理,從個人助理到繪圖再到研究類一應俱全,幫助您提高生產力。
本篇參與的主題策展
先前麥克買了在預算及性能方面都十分複合需求的NXTPAPER 11平板,但拿到辦公室使用後便發現因為時不時有簡報需求,主機本身不支援有線視訊輸出實在是非常不方便,因又開始尋找新歡。最終麥克選擇了算是還滿熟悉的品牌小米旗下的小米平板6,以下為麥克這一個月下來的使用心得。
從預計的十月底出貨經過重重波折,Pubu自家開發的10寸彩色閱讀器Pubook Pro終於是送到第一批集資者手中了。究竟這台閱讀器有沒有本事撼動目前的電子紙閱讀器市場?有達到集資時承諾的各項功能嗎?且讓身為首批集資者之一的麥克跟大家談談收到主機後使用數天的感想。
Steam Deck 迎來大改版,最重要的更新就是換成 OLED 螢幕。使用 OLED 螢幕帶來更好看的顏色,大小還小幅提升到 7.4 吋。關係續航力的電池也從 40 瓦小時升級到 50 瓦小時, 3A 大作都可以多玩一小時呢!這麼香的更新,怎麼不給他買下去呢 😄
先前麥克買了在預算及性能方面都十分複合需求的NXTPAPER 11平板,但拿到辦公室使用後便發現因為時不時有簡報需求,主機本身不支援有線視訊輸出實在是非常不方便,因又開始尋找新歡。最終麥克選擇了算是還滿熟悉的品牌小米旗下的小米平板6,以下為麥克這一個月下來的使用心得。
從預計的十月底出貨經過重重波折,Pubu自家開發的10寸彩色閱讀器Pubook Pro終於是送到第一批集資者手中了。究竟這台閱讀器有沒有本事撼動目前的電子紙閱讀器市場?有達到集資時承諾的各項功能嗎?且讓身為首批集資者之一的麥克跟大家談談收到主機後使用數天的感想。
Steam Deck 迎來大改版,最重要的更新就是換成 OLED 螢幕。使用 OLED 螢幕帶來更好看的顏色,大小還小幅提升到 7.4 吋。關係續航力的電池也從 40 瓦小時升級到 50 瓦小時, 3A 大作都可以多玩一小時呢!這麼香的更新,怎麼不給他買下去呢 😄
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
關於《偶然與想像》,很多人已經針對劇本發表感想與分析了。但《偶然與想像》在聲音的設計上,也是極其日式精細的。我想來記錄一下三個深深鐫印在我心中的聲音時刻。盡量不劇透,但還是難免有一點點透。
Thumbnail
TOP10 個你應加入小倉鼠PODCAST的理由!接續上篇的分析,接下來讓我們一一分析第6~10個為什麼加入podcast理由! 【感謝粉絲回饋:點這直接聽,免下載!】 https://podcasts.apple.com/podcast/1621682685 用聽的搶先掌握最新知識!
Thumbnail
TOP10 個你應加入小倉鼠PODCAST的理由!讓我們一一分析! 1.影像市場已是紅海,聲音經濟正邁向上噴發! 2電視收視率成謎,穿戴裝置推升語音廣告客製化 質化分析收集聽眾收聽習慣及偏好 3收聽者鮮明精確,創造客製化與互動性 4.電視和網路廣告,講求衝動下單! 用聽的搶先掌握最新知識!
Thumbnail
聲音媒體「時間的部分」的擴大,使podcast的接收需求激增!除了本來「會」看影片的人,即有族群的「使用時間」擴大,擴大了Podcast市場規模! 1聲音媒體的特性,使「時間的部分」的擴大 2.邊做事邊聽,可處分的時間比起影像多3倍 3.知識型內容,靜心傾聽,聲波直入腦門,效益大比用眼大!
Thumbnail
為什麼聲音媒體,比起影像或是圖片媒體的族群,會更加擴大呢?這要用幾個方向來說明: 「人的部分」的擴大,使podcast的接收族群擴大激增! 1. 「不能看」的族群: 2. 「不會看」的族群: 3. 「不便看」的族群: 4「不愛看」的族群: 【關於主理人: 小倉鼠】
Thumbnail
為什麼所有內容創作者都應加入語音革命?因為未來的人們接收的方式,不再是用手製作,用眼接收;而會變成用嘴製作,用耳朵接受,這是一個耳機取代手機的資訊介面的巨大革命。 多次介面革命 一樣令人驚奇! 手機發明之前,我們也一樣不可思議! 科技始終來自於人性,可以用耳機,又何必拿出手機! -----
Thumbnail
想了解「聲音經濟」最快的方法,莫過於坐計程車。古典樂、流行音樂、談話性節目,甚至是地下電台的賣藥廣播,應有盡有,但最近開始出現聽 Podcast 的司機:「我可以選擇想收聽的主題,而且不受播出時間的限制,隨時都可以再聽一次,甚至選擇段落,非常具有彈性」。
動動沒有聲音; (我基本上沒有在使用動態) 小精靈告訴我歌手S的一首歌 我問po在哪裡 小精靈回覆限時動態 於是我把限時動態全部點完 但一首歌都沒發現 只有一個在移動的音軌畫面 我:最後這個動態嗎?沒有聲音阿! 你:這個動動!哪會有聲音阿!被你笑死,什麼沒有聲音! 我:喔......我以為他是錄影,
Thumbnail
此篇文章將由我這個頻道即將剛滿一年的奈米級Podcaster來跟大家談談製作Podcast的甘苦談。 Podcast真的是藍海市場?處處是機會嗎? 你也想成為Podcaster嗎?閱讀完這篇文章再來思考要不要跳進這篇汪洋也不遲。 本篇文章皆為個人經驗,我相信每位創作者都有自己的一套方法。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
關於《偶然與想像》,很多人已經針對劇本發表感想與分析了。但《偶然與想像》在聲音的設計上,也是極其日式精細的。我想來記錄一下三個深深鐫印在我心中的聲音時刻。盡量不劇透,但還是難免有一點點透。
Thumbnail
TOP10 個你應加入小倉鼠PODCAST的理由!接續上篇的分析,接下來讓我們一一分析第6~10個為什麼加入podcast理由! 【感謝粉絲回饋:點這直接聽,免下載!】 https://podcasts.apple.com/podcast/1621682685 用聽的搶先掌握最新知識!
Thumbnail
TOP10 個你應加入小倉鼠PODCAST的理由!讓我們一一分析! 1.影像市場已是紅海,聲音經濟正邁向上噴發! 2電視收視率成謎,穿戴裝置推升語音廣告客製化 質化分析收集聽眾收聽習慣及偏好 3收聽者鮮明精確,創造客製化與互動性 4.電視和網路廣告,講求衝動下單! 用聽的搶先掌握最新知識!
Thumbnail
聲音媒體「時間的部分」的擴大,使podcast的接收需求激增!除了本來「會」看影片的人,即有族群的「使用時間」擴大,擴大了Podcast市場規模! 1聲音媒體的特性,使「時間的部分」的擴大 2.邊做事邊聽,可處分的時間比起影像多3倍 3.知識型內容,靜心傾聽,聲波直入腦門,效益大比用眼大!
Thumbnail
為什麼聲音媒體,比起影像或是圖片媒體的族群,會更加擴大呢?這要用幾個方向來說明: 「人的部分」的擴大,使podcast的接收族群擴大激增! 1. 「不能看」的族群: 2. 「不會看」的族群: 3. 「不便看」的族群: 4「不愛看」的族群: 【關於主理人: 小倉鼠】
Thumbnail
為什麼所有內容創作者都應加入語音革命?因為未來的人們接收的方式,不再是用手製作,用眼接收;而會變成用嘴製作,用耳朵接受,這是一個耳機取代手機的資訊介面的巨大革命。 多次介面革命 一樣令人驚奇! 手機發明之前,我們也一樣不可思議! 科技始終來自於人性,可以用耳機,又何必拿出手機! -----
Thumbnail
想了解「聲音經濟」最快的方法,莫過於坐計程車。古典樂、流行音樂、談話性節目,甚至是地下電台的賣藥廣播,應有盡有,但最近開始出現聽 Podcast 的司機:「我可以選擇想收聽的主題,而且不受播出時間的限制,隨時都可以再聽一次,甚至選擇段落,非常具有彈性」。
動動沒有聲音; (我基本上沒有在使用動態) 小精靈告訴我歌手S的一首歌 我問po在哪裡 小精靈回覆限時動態 於是我把限時動態全部點完 但一首歌都沒發現 只有一個在移動的音軌畫面 我:最後這個動態嗎?沒有聲音阿! 你:這個動動!哪會有聲音阿!被你笑死,什麼沒有聲音! 我:喔......我以為他是錄影,
Thumbnail
此篇文章將由我這個頻道即將剛滿一年的奈米級Podcaster來跟大家談談製作Podcast的甘苦談。 Podcast真的是藍海市場?處處是機會嗎? 你也想成為Podcaster嗎?閱讀完這篇文章再來思考要不要跳進這篇汪洋也不遲。 本篇文章皆為個人經驗,我相信每位創作者都有自己的一套方法。