聲音經濟 (Voice Economy):AI世代的商業革命

更新於 發佈於 閱讀時間約 8 分鐘

聲音經濟 (Voice Economy) 是指以聲音為基礎的商業模式、技術與應用,用於創造價值和增加用戶體驗,舉凡音樂數位下載、串流媒體、電話行銷/客服、語音導覽、廣播/有聲書/Podcast...等皆代表一定規模的市場價值 。如今在AI浪潮席捲下,藉由AI改變聲音的創作、傳播與消費而將聲音轉換為商業價值和新機會,已掀起另一波商業革命,筆者預期將大幅改變我們與科技和品牌互動的方式。

raw-image

幾個不容忽視的數據

  • 超過三分之一的美國家庭擁有智慧音箱1
  • 台灣每5人就有1人收聽Podcast1
  • 2021年Podcast廣告年收益已超過10億美元1
  • Spotify美國Podcast聽眾人數在2023年將成長至3,750萬人1
  • 58%美國消費者表示會使用聲控技術,因為對某些任務來說更容易、方便2
  • 46%美國消費者認為,語音助理將在不到五年內像人類一樣聰明、可靠2
  • 28%美國消費者願意為語音助理服務付費2

(參考來源:1. 聲音經濟:從語音助理、Podcast到智慧音箱,科技巨頭爭相搶進的新市場 2. How Consumers Want to Live in the Voice Economy | PYMNTS)

聲音經濟的興起

聲音經濟之興起從聲音數位化 (Digitalization) 帶動聲音科技進步開始。當類比 (Analog) 訊號走入歷史,數位時代無論聲音之品質、傳遞及保存方式,皆克服了過往類比時代的種種不便及限制。隨後因網路科技蓬勃發展,伴隨各類型裝置 (如MP3、iPod、智慧型手機、平板等)、媒體平台 (例如串流影音) 的問世,造就消費者習慣改變而衍生出許多不同的商業需求,例如音樂數位下載、線上收聽、語音導覽/客服、Podcast等。近幾年Covid-19的肆虐衝擊,更促進了非接觸式聲音經濟的蓬勃發展。

進入AI時代後,由於自然語音處理 (NLP, Neuro-Linguistic Programming)、機器學習 (ML, Machine Learning)、大型語言模型 (LLM, Large Language Models) 和語音識別 (ASR, Automatic Speech Recognition) 等技術日益成熟,聲音科技在商業模式上的應用逐漸邁入新的紀元。從以下研究整理,可以顯見AI世代聲音經濟的龐大商機。

虛擬語音助理 (Virtual Assistant)

虛擬助理 (Virtual Assistant) 是一種基於AI科技實現理解使用者輸入之命令或問題並提供回應 (包含回答或執行任務) 之技術,可透過文字、圖形介面或語音 (通常結合聊天機器人功能來模擬人類對話) 等方式與用戶互動。在科技大廠的帶動下,AI語音助理已大量應用在各類型智慧型裝置上,較知名者包括蘋果的Siri、亞馬遜Alexa、Google Assistant和三星的Bixby;而各行業公司也經常將某種虛擬助理技術納入其客戶服務或支援之中。(參考來源:Virtual assistant | 維基百科)

據IMIR研究分析師表示,2021年全球AI語音助理市場規模為29億美元,預計到2028年將達到150億美元,2021年至2028年複合年增長率為28%。(參考來源:Global Voice Assistant Market Research Report | IMIR)

智慧音箱 (Smart Speaker)

智慧音箱 (Smart Speaker) 是一種無線智慧家居音訊設備,可透過語音命令啟動聽音樂、訂餐、線上購物等,並使用多種連接類型來提供環控、保全等附加功能。根據Verified Market Research研究報告,2021年智慧音箱市場規模為80.2億美元,預計到2030年將達到320.5億美元,2022年至2030年複合年增長率為16.65%。(參考來源:Smart Speaker Market Size And Forecast | VMR)

根據Statista Consumer Insights 2022年美國智慧音箱市佔率調查結果,美國智慧音箱用戶中有67%擁有Amazon Echo,Google Home及其繼任產品Google Nest受歡迎程度排名第二 (27%) 和第四 (18%) ,21%家中擁有HomePod,而Sony亦躋身前五名。(參考來源:Amazon Dominates the U.S. Smart Speaker Market | statista)

AI文字生成語音 (TTS, Text-to-Speech)

在眾多生成式AI當中,AI文字生成語音 (TTS, Text-to-Speech) 是一種透過AI將文字腳本轉換為人類自然語音的人工智慧技術,可用於產生電影、廣告、遊戲和其他用途的人聲而大幅減少錄製真實語音的時間及成本。據market.us估計至2032年,AI語音生成市場規模將達到49億美元,年複合成長率15.40%。潛力市場涵蓋醫療保健、銀行/金融服務/保險、製造、廣告和媒體及其他最終用途行業,並應用於包括聊天機器人、虛擬助理和語音設備等。(參考來源:AI Voice Generator Market Research | market.us

語音辨識和語音合成是長久以來人工智慧技術發展的重點,其語音呈現的擬真與自然程度足以反映AI科技成熟度。在Google、微軟、蘋果等科技先驅引領下,現今AI生成語音已進入百家爭鳴,除了跨越多國語言藩籬,其自然度也多能貼近真實人聲。例如筆者任職公司所推出的TTS服務 - ATEN優聲學,便是其中標榜在地化純正台灣口音、有溫度的擬真AI voice而獨樹一格。

Podcast

近年來,憑藉媒體生態與消費習慣轉變、無線耳機普及和Apple Podcast和Spotify等串流平台的全力支持,Podcast從小眾自媒體搖身一變成了各界搶進的新興主流媒體。根據IAB和PWC分析,2025年美國Podcast廣告收入估計將成長一倍以上,達到40億美元左右。(參考來源:U.S Podcast Advertising Revenue Study 2023 | IAB and PWC)

台灣Podcast的興起雖起步較晚,然據SoundOn聲浪發表之報告,2022年台灣Podcast商案合作市值估計近10億元,使得2022年被譽為台灣聲音變現元年,未來成長潛力可期。(參考來源:2022年度聲音經濟報告書 | SoundOn)

而AI也可說是Podcast興盛的幕後推手之一,例如Spotify串流媒體平台創立以來在市場獲得無比成功,總市值達到470億美元 (參考來源:Google Finance 2024-2-15收盤),背後即是基於強大的深度學習技術改善其個人化及推薦功能。此外,Spotify於2023-9-25發表podcast語音翻譯試播功能 (Voice Translation for podcast),這是一項由AI提供支援的突破性技術,可將podcast翻譯成其他語言 (包括西班牙語、法語和德語),驚人的是,全部以podcasters的原音呈現。相信讀者不難想像,在此項技術更為成熟之後,將大幅造就Podcast另一波全球影響力。(參考來源:Voice Translation on Spotify)

聲音經濟的未來

從以上產業趨勢可知,聲音經濟在科技持續進化和AI的推波助瀾之下,勢將衍生更多創新、便利和個人化應用,而產生極大的商業模式創新和創業機會。然而AI隱含的法律、隱私、倫理和安全性議題仍有待時間考驗與秩序調合,而多國語系與自然發音的隔閡也挑戰語音科技的後續發展,這一切都值得我們更多的資源投入與密切關注。

avatar-img
2會員
2內容數
臺灣科技大學管研所博士候選人 / 任職跨國科技業總經理室 - 關注科技應用、體驗行銷、卓越商業促進等專業領域,拿過論文獎、個案競賽冠軍,籌辦過國際會議、慈善音樂會等大小活動,熱愛探索新知並重視生活的雙子大叔。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
項博研究室 的其他內容
ChatGPT 自2022年11月問世以降,開啟了生成式AI (Generative AI,也稱AIGC, AI Generated Content) 技術和應用的爆炸性發展。本篇文章提供了各種類型的AIGC工具整理,從個人助理到繪圖再到研究類一應俱全,幫助您提高生產力。
ChatGPT 自2022年11月問世以降,開啟了生成式AI (Generative AI,也稱AIGC, AI Generated Content) 技術和應用的爆炸性發展。本篇文章提供了各種類型的AIGC工具整理,從個人助理到繪圖再到研究類一應俱全,幫助您提高生產力。
本篇參與的主題活動
每次過完農曆年,麥克最期待的活動就是書展了!麥克這次不惜翻山越嶺披星戴月三顧茅廬七出祁山來到2025年台北國際書展,看看書展現場都有些甚麼酷主機出現。大家趕緊繫上安全帶,麥克要發車啦!
先前麥克買了在預算及性能方面都十分複合需求的NXTPAPER 11平板,但拿到辦公室使用後便發現因為時不時有簡報需求,主機本身不支援有線視訊輸出實在是非常不方便,因又開始尋找新歡。最終麥克選擇了算是還滿熟悉的品牌小米旗下的小米平板6,以下為麥克這一個月下來的使用心得。
從預計的十月底出貨經過重重波折,Pubu自家開發的10寸彩色閱讀器Pubook Pro終於是送到第一批集資者手中了。究竟這台閱讀器有沒有本事撼動目前的電子紙閱讀器市場?有達到集資時承諾的各項功能嗎?且讓身為首批集資者之一的麥克跟大家談談收到主機後使用數天的感想。
Steam Deck 迎來大改版,最重要的更新就是換成 OLED 螢幕。使用 OLED 螢幕帶來更好看的顏色,大小還小幅提升到 7.4 吋。關係續航力的電池也從 40 瓦小時升級到 50 瓦小時, 3A 大作都可以多玩一小時呢!這麼香的更新,怎麼不給他買下去呢 😄
每次過完農曆年,麥克最期待的活動就是書展了!麥克這次不惜翻山越嶺披星戴月三顧茅廬七出祁山來到2025年台北國際書展,看看書展現場都有些甚麼酷主機出現。大家趕緊繫上安全帶,麥克要發車啦!
先前麥克買了在預算及性能方面都十分複合需求的NXTPAPER 11平板,但拿到辦公室使用後便發現因為時不時有簡報需求,主機本身不支援有線視訊輸出實在是非常不方便,因又開始尋找新歡。最終麥克選擇了算是還滿熟悉的品牌小米旗下的小米平板6,以下為麥克這一個月下來的使用心得。
從預計的十月底出貨經過重重波折,Pubu自家開發的10寸彩色閱讀器Pubook Pro終於是送到第一批集資者手中了。究竟這台閱讀器有沒有本事撼動目前的電子紙閱讀器市場?有達到集資時承諾的各項功能嗎?且讓身為首批集資者之一的麥克跟大家談談收到主機後使用數天的感想。
Steam Deck 迎來大改版,最重要的更新就是換成 OLED 螢幕。使用 OLED 螢幕帶來更好看的顏色,大小還小幅提升到 7.4 吋。關係續航力的電池也從 40 瓦小時升級到 50 瓦小時, 3A 大作都可以多玩一小時呢!這麼香的更新,怎麼不給他買下去呢 😄
你可能也想看
Google News 追蹤
Thumbnail
在創作的路上真的很多人問我說 到底要怎麼做出符合自己期待 但又可以表現得很有美感的作品?🥹 這個問題真的應該是每個創作者都一直在學習的課題吧!
提問的內容越是清晰,強者、聰明人越能在短時間內做判斷、給出精準的建議,他們會對你產生「好印象」,認定你是「積極」的人,有機會、好人脈會不自覺地想引薦給你
Thumbnail
攝影:Nicole L.  聽聽,雪的音聲!  ──關于電影《超越寂靜》 ——梁寒衣 生命的暗流咆哮,嘈噪嘔啞…… 然而,雪,還是要下的罷。  寂靜無垠地,  穿越城鎮與街道,弭平溝塹與深谷——    凡夫眾生的愛,俱含有難以察覺的雜染,俱以戀執,綁縛,占有,支配為核心。它強烈具
Thumbnail
夢見我來到一個房子,裡面有幾個老人,其中有一個老人感覺他是我爸爸,可是不是現實生活裡面的爸爸,是夢裡面的爸爸。他很生氣,對我很失望,因為我參加演講比賽的時候,在台上竟然忘記稿子。 我想起國小時候,我是演講比賽的常勝軍,因為我的咬字發音算是相當清楚。我的演講稿都是爸爸寫的,我來背稿,爸爸還教我各種手
Thumbnail
夢見我在一個城市,我們和另一個城市 (好像叫河口) 只有一牆之隔,他們在淹水,而我們這邊繁華如常。 下班後,我跟一位女同事去逛街。我們來到一條路上,有許多名牌店,也有不少路邊攤位。我問同事是否曾逛過這些路邊攤。 她說逛過,他們賣的商品看起來都是名牌,但她搞不清楚是正品還是仿冒品。我跟她說我也這麼
這陣子跟家人討論著前東家的事情,我們在思考為什麼一個主管可以偏心到這麼令人匪夷所思的地步,故只猜測了是不是有拿人好處的事情,畢竟毫無證據的狀態,自己私下猜猜到是無妨,卻也在這時候,我想起了之前某個台中經銷商玩過一個手法,由於此招只要你是屬於熱心幫忙的類型,並且認為經銷是自己管理的並納為己任的心態原則
Thumbnail
PopPop AI 推出的免費線上音效產生器可以將文字轉換為各種聲音,包括自然、人類、樂器、環境和特殊效果等。支援多種語言,使用者可以輸入中文描述創建音效,並可直接播放聆聽和下載音訊。
Thumbnail
本週 AI 趨勢帶來了三個超酷的黑科技,包括語言翻譯耳機、AI 教練和 AI 音樂製作工具。這些創新科技幫助解決語言溝通、健身指導和音樂創作等問題,是數據、人工智慧和科技的未來。快來瞭解如何應用這些科技,打造更豐富的生活體驗吧!
Thumbnail
當妳的哀傷,無人可以理解, 妳的真實樣貌將永遠被鎖在那個受傷的時刻。看起來無比弱小且充滿淚水。 當那人走進無邊無際的黑夜之中,他與當時的妳,一樣無助。 放聲哭喊,沒有誰能聽見。 不是的,有人聽見的。擁有上帝視角的觀眾想如此回應他。 愛你的人,永遠在尋找你的路上。 愛很強大,但需要被擁抱才能將溫度
Thumbnail
OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音
Thumbnail
在創作的路上真的很多人問我說 到底要怎麼做出符合自己期待 但又可以表現得很有美感的作品?🥹 這個問題真的應該是每個創作者都一直在學習的課題吧!
提問的內容越是清晰,強者、聰明人越能在短時間內做判斷、給出精準的建議,他們會對你產生「好印象」,認定你是「積極」的人,有機會、好人脈會不自覺地想引薦給你
Thumbnail
攝影:Nicole L.  聽聽,雪的音聲!  ──關于電影《超越寂靜》 ——梁寒衣 生命的暗流咆哮,嘈噪嘔啞…… 然而,雪,還是要下的罷。  寂靜無垠地,  穿越城鎮與街道,弭平溝塹與深谷——    凡夫眾生的愛,俱含有難以察覺的雜染,俱以戀執,綁縛,占有,支配為核心。它強烈具
Thumbnail
夢見我來到一個房子,裡面有幾個老人,其中有一個老人感覺他是我爸爸,可是不是現實生活裡面的爸爸,是夢裡面的爸爸。他很生氣,對我很失望,因為我參加演講比賽的時候,在台上竟然忘記稿子。 我想起國小時候,我是演講比賽的常勝軍,因為我的咬字發音算是相當清楚。我的演講稿都是爸爸寫的,我來背稿,爸爸還教我各種手
Thumbnail
夢見我在一個城市,我們和另一個城市 (好像叫河口) 只有一牆之隔,他們在淹水,而我們這邊繁華如常。 下班後,我跟一位女同事去逛街。我們來到一條路上,有許多名牌店,也有不少路邊攤位。我問同事是否曾逛過這些路邊攤。 她說逛過,他們賣的商品看起來都是名牌,但她搞不清楚是正品還是仿冒品。我跟她說我也這麼
這陣子跟家人討論著前東家的事情,我們在思考為什麼一個主管可以偏心到這麼令人匪夷所思的地步,故只猜測了是不是有拿人好處的事情,畢竟毫無證據的狀態,自己私下猜猜到是無妨,卻也在這時候,我想起了之前某個台中經銷商玩過一個手法,由於此招只要你是屬於熱心幫忙的類型,並且認為經銷是自己管理的並納為己任的心態原則
Thumbnail
PopPop AI 推出的免費線上音效產生器可以將文字轉換為各種聲音,包括自然、人類、樂器、環境和特殊效果等。支援多種語言,使用者可以輸入中文描述創建音效,並可直接播放聆聽和下載音訊。
Thumbnail
本週 AI 趨勢帶來了三個超酷的黑科技,包括語言翻譯耳機、AI 教練和 AI 音樂製作工具。這些創新科技幫助解決語言溝通、健身指導和音樂創作等問題,是數據、人工智慧和科技的未來。快來瞭解如何應用這些科技,打造更豐富的生活體驗吧!
Thumbnail
當妳的哀傷,無人可以理解, 妳的真實樣貌將永遠被鎖在那個受傷的時刻。看起來無比弱小且充滿淚水。 當那人走進無邊無際的黑夜之中,他與當時的妳,一樣無助。 放聲哭喊,沒有誰能聽見。 不是的,有人聽見的。擁有上帝視角的觀眾想如此回應他。 愛你的人,永遠在尋找你的路上。 愛很強大,但需要被擁抱才能將溫度
Thumbnail
OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音