聲音經濟 (Voice Economy):AI世代的商業革命

更新於 發佈於 閱讀時間約 8 分鐘

聲音經濟 (Voice Economy) 是指以聲音為基礎的商業模式、技術與應用,用於創造價值和增加用戶體驗,舉凡音樂數位下載、串流媒體、電話行銷/客服、語音導覽、廣播/有聲書/Podcast...等皆代表一定規模的市場價值 。如今在AI浪潮席捲下,藉由AI改變聲音的創作、傳播與消費而將聲音轉換為商業價值和新機會,已掀起另一波商業革命,筆者預期將大幅改變我們與科技和品牌互動的方式。

raw-image

幾個不容忽視的數據

  • 超過三分之一的美國家庭擁有智慧音箱1
  • 台灣每5人就有1人收聽Podcast1
  • 2021年Podcast廣告年收益已超過10億美元1
  • Spotify美國Podcast聽眾人數在2023年將成長至3,750萬人1
  • 58%美國消費者表示會使用聲控技術,因為對某些任務來說更容易、方便2
  • 46%美國消費者認為,語音助理將在不到五年內像人類一樣聰明、可靠2
  • 28%美國消費者願意為語音助理服務付費2

(參考來源:1. 聲音經濟:從語音助理、Podcast到智慧音箱,科技巨頭爭相搶進的新市場 2. How Consumers Want to Live in the Voice Economy | PYMNTS)

聲音經濟的興起

聲音經濟之興起從聲音數位化 (Digitalization) 帶動聲音科技進步開始。當類比 (Analog) 訊號走入歷史,數位時代無論聲音之品質、傳遞及保存方式,皆克服了過往類比時代的種種不便及限制。隨後因網路科技蓬勃發展,伴隨各類型裝置 (如MP3、iPod、智慧型手機、平板等)、媒體平台 (例如串流影音) 的問世,造就消費者習慣改變而衍生出許多不同的商業需求,例如音樂數位下載、線上收聽、語音導覽/客服、Podcast等。近幾年Covid-19的肆虐衝擊,更促進了非接觸式聲音經濟的蓬勃發展。

進入AI時代後,由於自然語音處理 (NLP, Neuro-Linguistic Programming)、機器學習 (ML, Machine Learning)、大型語言模型 (LLM, Large Language Models) 和語音識別 (ASR, Automatic Speech Recognition) 等技術日益成熟,聲音科技在商業模式上的應用逐漸邁入新的紀元。從以下研究整理,可以顯見AI世代聲音經濟的龐大商機。

虛擬語音助理 (Virtual Assistant)

虛擬助理 (Virtual Assistant) 是一種基於AI科技實現理解使用者輸入之命令或問題並提供回應 (包含回答或執行任務) 之技術,可透過文字、圖形介面或語音 (通常結合聊天機器人功能來模擬人類對話) 等方式與用戶互動。在科技大廠的帶動下,AI語音助理已大量應用在各類型智慧型裝置上,較知名者包括蘋果的Siri、亞馬遜Alexa、Google Assistant和三星的Bixby;而各行業公司也經常將某種虛擬助理技術納入其客戶服務或支援之中。(參考來源:Virtual assistant | 維基百科)

據IMIR研究分析師表示,2021年全球AI語音助理市場規模為29億美元,預計到2028年將達到150億美元,2021年至2028年複合年增長率為28%。(參考來源:Global Voice Assistant Market Research Report | IMIR)

智慧音箱 (Smart Speaker)

智慧音箱 (Smart Speaker) 是一種無線智慧家居音訊設備,可透過語音命令啟動聽音樂、訂餐、線上購物等,並使用多種連接類型來提供環控、保全等附加功能。根據Verified Market Research研究報告,2021年智慧音箱市場規模為80.2億美元,預計到2030年將達到320.5億美元,2022年至2030年複合年增長率為16.65%。(參考來源:Smart Speaker Market Size And Forecast | VMR)

根據Statista Consumer Insights 2022年美國智慧音箱市佔率調查結果,美國智慧音箱用戶中有67%擁有Amazon Echo,Google Home及其繼任產品Google Nest受歡迎程度排名第二 (27%) 和第四 (18%) ,21%家中擁有HomePod,而Sony亦躋身前五名。(參考來源:Amazon Dominates the U.S. Smart Speaker Market | statista)

AI文字生成語音 (TTS, Text-to-Speech)

在眾多生成式AI當中,AI文字生成語音 (TTS, Text-to-Speech) 是一種透過AI將文字腳本轉換為人類自然語音的人工智慧技術,可用於產生電影、廣告、遊戲和其他用途的人聲而大幅減少錄製真實語音的時間及成本。據market.us估計至2032年,AI語音生成市場規模將達到49億美元,年複合成長率15.40%。潛力市場涵蓋醫療保健、銀行/金融服務/保險、製造、廣告和媒體及其他最終用途行業,並應用於包括聊天機器人、虛擬助理和語音設備等。(參考來源:AI Voice Generator Market Research | market.us

語音辨識和語音合成是長久以來人工智慧技術發展的重點,其語音呈現的擬真與自然程度足以反映AI科技成熟度。在Google、微軟、蘋果等科技先驅引領下,現今AI生成語音已進入百家爭鳴,除了跨越多國語言藩籬,其自然度也多能貼近真實人聲。例如筆者任職公司所推出的TTS服務 - ATEN優聲學,便是其中標榜在地化純正台灣口音、有溫度的擬真AI voice而獨樹一格。

Podcast

近年來,憑藉媒體生態與消費習慣轉變、無線耳機普及和Apple Podcast和Spotify等串流平台的全力支持,Podcast從小眾自媒體搖身一變成了各界搶進的新興主流媒體。根據IAB和PWC分析,2025年美國Podcast廣告收入估計將成長一倍以上,達到40億美元左右。(參考來源:U.S Podcast Advertising Revenue Study 2023 | IAB and PWC)

台灣Podcast的興起雖起步較晚,然據SoundOn聲浪發表之報告,2022年台灣Podcast商案合作市值估計近10億元,使得2022年被譽為台灣聲音變現元年,未來成長潛力可期。(參考來源:2022年度聲音經濟報告書 | SoundOn)

而AI也可說是Podcast興盛的幕後推手之一,例如Spotify串流媒體平台創立以來在市場獲得無比成功,總市值達到470億美元 (參考來源:Google Finance 2024-2-15收盤),背後即是基於強大的深度學習技術改善其個人化及推薦功能。此外,Spotify於2023-9-25發表podcast語音翻譯試播功能 (Voice Translation for podcast),這是一項由AI提供支援的突破性技術,可將podcast翻譯成其他語言 (包括西班牙語、法語和德語),驚人的是,全部以podcasters的原音呈現。相信讀者不難想像,在此項技術更為成熟之後,將大幅造就Podcast另一波全球影響力。(參考來源:Voice Translation on Spotify)

聲音經濟的未來

從以上產業趨勢可知,聲音經濟在科技持續進化和AI的推波助瀾之下,勢將衍生更多創新、便利和個人化應用,而產生極大的商業模式創新和創業機會。然而AI隱含的法律、隱私、倫理和安全性議題仍有待時間考驗與秩序調合,而多國語系與自然發音的隔閡也挑戰語音科技的後續發展,這一切都值得我們更多的資源投入與密切關注。

avatar-img
2會員
2內容數
臺灣科技大學管研所博士候選人 / 任職跨國科技業總經理室 - 關注科技應用、體驗行銷、卓越商業促進等專業領域,拿過論文獎、個案競賽冠軍,籌辦過國際會議、慈善音樂會等大小活動,熱愛探索新知並重視生活的雙子大叔。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
項博研究室 的其他內容
ChatGPT 自2022年11月問世以降,開啟了生成式AI (Generative AI,也稱AIGC, AI Generated Content) 技術和應用的爆炸性發展。本篇文章提供了各種類型的AIGC工具整理,從個人助理到繪圖再到研究類一應俱全,幫助您提高生產力。
ChatGPT 自2022年11月問世以降,開啟了生成式AI (Generative AI,也稱AIGC, AI Generated Content) 技術和應用的爆炸性發展。本篇文章提供了各種類型的AIGC工具整理,從個人助理到繪圖再到研究類一應俱全,幫助您提高生產力。
本篇參與的主題活動
先前麥克買了在預算及性能方面都十分複合需求的NXTPAPER 11平板,但拿到辦公室使用後便發現因為時不時有簡報需求,主機本身不支援有線視訊輸出實在是非常不方便,因又開始尋找新歡。最終麥克選擇了算是還滿熟悉的品牌小米旗下的小米平板6,以下為麥克這一個月下來的使用心得。
從預計的十月底出貨經過重重波折,Pubu自家開發的10寸彩色閱讀器Pubook Pro終於是送到第一批集資者手中了。究竟這台閱讀器有沒有本事撼動目前的電子紙閱讀器市場?有達到集資時承諾的各項功能嗎?且讓身為首批集資者之一的麥克跟大家談談收到主機後使用數天的感想。
Steam Deck 迎來大改版,最重要的更新就是換成 OLED 螢幕。使用 OLED 螢幕帶來更好看的顏色,大小還小幅提升到 7.4 吋。關係續航力的電池也從 40 瓦小時升級到 50 瓦小時, 3A 大作都可以多玩一小時呢!這麼香的更新,怎麼不給他買下去呢 😄
先前麥克買了在預算及性能方面都十分複合需求的NXTPAPER 11平板,但拿到辦公室使用後便發現因為時不時有簡報需求,主機本身不支援有線視訊輸出實在是非常不方便,因又開始尋找新歡。最終麥克選擇了算是還滿熟悉的品牌小米旗下的小米平板6,以下為麥克這一個月下來的使用心得。
從預計的十月底出貨經過重重波折,Pubu自家開發的10寸彩色閱讀器Pubook Pro終於是送到第一批集資者手中了。究竟這台閱讀器有沒有本事撼動目前的電子紙閱讀器市場?有達到集資時承諾的各項功能嗎?且讓身為首批集資者之一的麥克跟大家談談收到主機後使用數天的感想。
Steam Deck 迎來大改版,最重要的更新就是換成 OLED 螢幕。使用 OLED 螢幕帶來更好看的顏色,大小還小幅提升到 7.4 吋。關係續航力的電池也從 40 瓦小時升級到 50 瓦小時, 3A 大作都可以多玩一小時呢!這麼香的更新,怎麼不給他買下去呢 😄
你可能也想看
Google News 追蹤
Thumbnail
大家好,我是woody,是一名料理創作者,非常努力地在嘗試將複雜的料理簡單化,讓大家也可以體驗到料理的樂趣而我也非常享受料理的過程,今天想跟大家聊聊,除了料理本身,料理創作背後的成本。
Thumbnail
哈囉~很久沒跟各位自我介紹一下了~ 大家好~我是爺恩 我是一名圖文插畫家,有追蹤我一段時間的應該有發現爺恩這個品牌經營了好像.....快五年了(汗)時間過得真快!隨著時間過去,創作這件事好像變得更忙碌了,也很開心跟很多厲害的創作者以及廠商互相合作幫忙,還有最重要的是大家的支持與陪伴🥹。  
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
PopPop AI 推出的免費線上音效產生器可以將文字轉換為各種聲音,包括自然、人類、樂器、環境和特殊效果等。支援多種語言,使用者可以輸入中文描述創建音效,並可直接播放聆聽和下載音訊。
Thumbnail
本週 AI 趨勢帶來了三個超酷的黑科技,包括語言翻譯耳機、AI 教練和 AI 音樂製作工具。這些創新科技幫助解決語言溝通、健身指導和音樂創作等問題,是數據、人工智慧和科技的未來。快來瞭解如何應用這些科技,打造更豐富的生活體驗吧!
Thumbnail
OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音
Thumbnail
合成聲音技術的未來充滿希望,也存在挑戰。OpenAI呼籲社會各界一起加強對這一新興技術的認識,並共同探索如何有效地利用這項技術,同時保護公眾免受潛在的負面影響。
隨著語音搜尋技術的進步和普及,它對搜索引擎優化(SEO)的前景產生了深遠的影響。本文將探討語音搜尋對SEO的影響及未來發展,並介紹相關的SEO服務和趨勢。 語音搜尋的普及使得人們可以通過語音命令來進行搜索,而不再需要輸入文字。這使得搜索過程更加便捷和自然,也提高了搜索的準確性和效率。然而,對於SE
Thumbnail
AI 對於這個世界絕對是全新的幫助,也有明確的商業模式 你再也不需要請人寫文案,照片和影像可以即時產出 對於語言和世界的理銞也會變得快速 這一切都在快速地改變世界當中 但其危險的是,隱隱約約有著要泡沬化的步調
Thumbnail
隨著生成式 AI (Generative AI ) 2023年大紅大紫,許多人也正熱烈討論 AI 到底會不會讓人失業,這是個很有趣的話題,因為科技變革千百年來從未停止過,現在發生的事絕對不是新鮮事,我們就來從留聲機被發明到被反對,甚至被視為危害文明的歷史反思當前的科技趨勢。 本文可以讓你學到什
Thumbnail
近日時代在快速演進,行銷市場競爭越來越激烈,且各產業正面臨數位轉型、市場飽和等挑戰外,還得順應AI和科技潮流,為了能持續在競爭市場中繼續角逐廝殺,必須得不斷創新,為求能在市場中脫穎而出。而AI的發展,成為行銷領域的主要推動力,正為行銷市場帶來重大的變革
Thumbnail
大家好,我是woody,是一名料理創作者,非常努力地在嘗試將複雜的料理簡單化,讓大家也可以體驗到料理的樂趣而我也非常享受料理的過程,今天想跟大家聊聊,除了料理本身,料理創作背後的成本。
Thumbnail
哈囉~很久沒跟各位自我介紹一下了~ 大家好~我是爺恩 我是一名圖文插畫家,有追蹤我一段時間的應該有發現爺恩這個品牌經營了好像.....快五年了(汗)時間過得真快!隨著時間過去,創作這件事好像變得更忙碌了,也很開心跟很多厲害的創作者以及廠商互相合作幫忙,還有最重要的是大家的支持與陪伴🥹。  
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
PopPop AI 推出的免費線上音效產生器可以將文字轉換為各種聲音,包括自然、人類、樂器、環境和特殊效果等。支援多種語言,使用者可以輸入中文描述創建音效,並可直接播放聆聽和下載音訊。
Thumbnail
本週 AI 趨勢帶來了三個超酷的黑科技,包括語言翻譯耳機、AI 教練和 AI 音樂製作工具。這些創新科技幫助解決語言溝通、健身指導和音樂創作等問題,是數據、人工智慧和科技的未來。快來瞭解如何應用這些科技,打造更豐富的生活體驗吧!
Thumbnail
OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音
Thumbnail
合成聲音技術的未來充滿希望,也存在挑戰。OpenAI呼籲社會各界一起加強對這一新興技術的認識,並共同探索如何有效地利用這項技術,同時保護公眾免受潛在的負面影響。
隨著語音搜尋技術的進步和普及,它對搜索引擎優化(SEO)的前景產生了深遠的影響。本文將探討語音搜尋對SEO的影響及未來發展,並介紹相關的SEO服務和趨勢。 語音搜尋的普及使得人們可以通過語音命令來進行搜索,而不再需要輸入文字。這使得搜索過程更加便捷和自然,也提高了搜索的準確性和效率。然而,對於SE
Thumbnail
AI 對於這個世界絕對是全新的幫助,也有明確的商業模式 你再也不需要請人寫文案,照片和影像可以即時產出 對於語言和世界的理銞也會變得快速 這一切都在快速地改變世界當中 但其危險的是,隱隱約約有著要泡沬化的步調
Thumbnail
隨著生成式 AI (Generative AI ) 2023年大紅大紫,許多人也正熱烈討論 AI 到底會不會讓人失業,這是個很有趣的話題,因為科技變革千百年來從未停止過,現在發生的事絕對不是新鮮事,我們就來從留聲機被發明到被反對,甚至被視為危害文明的歷史反思當前的科技趨勢。 本文可以讓你學到什
Thumbnail
近日時代在快速演進,行銷市場競爭越來越激烈,且各產業正面臨數位轉型、市場飽和等挑戰外,還得順應AI和科技潮流,為了能持續在競爭市場中繼續角逐廝殺,必須得不斷創新,為求能在市場中脫穎而出。而AI的發展,成為行銷領域的主要推動力,正為行銷市場帶來重大的變革