Spotify聯手OpenAI

更新 發佈閱讀 2 分鐘

摘要:

Spotify推新AI功能,將podcast主持人的聲音翻譯成各國語言。

  • Spotify於9/25宣布推出新的人工智慧功能,該功能可保留主持人聲音特徵將播客內容翻成各國語言。
  • Spotify表示,該功能依賴於ChatGPT,該更新也在週一宣布(見文末試聽連結)。
  • OpenAI在一份聲明中表示,該技術可以僅使用幾秒鐘的語音就創建「逼真的合成聲音」。
raw-image

內文:

Spotify於週一(9/25)宣布推出新的人工智慧功能,可使用主持人自己的聲音將播客翻譯成不同語言。該公司表示,該功能依賴於OpenAI的語音生成技術,這技術可以僅使用幾秒鐘的語音創建「逼真的合成聲音」。

Spotify表示,該功能將有助於保持播客者的「獨特發音特徵」,從而使播客收聽體驗更加真實和自然。

Spotify與Dax Shepard、Lex Fridman、Monica Padman、Steven Bartlett和Bill Simmons等播客合作製作了一系列過去和即將推出的節目。該公司表示,這些節目最初被翻譯成西班牙語、法語和德語,並將在未來幾天和幾週內提供給免費用戶和付費訂閱用戶。

Spotify 目前表示,其全球範圍內有超過 1 億播客聽眾,並在 170 多個市場提供超過 500 萬個播客標題。根據 Edison Research 的數據,該公司是 2022 年第四季度至 2023 年第二季度基於覆蓋範圍的最大美國播客網絡。

Spotify沒有向CNBC透露新功能的具體成本。一位發言人補充說,該公司正在探索「向全球更多播客提供這項服務」的機會。例如,該公司已經在開發喜劇演員Trevor Noah即將推出的新播客。

Spotify在新聞稿中表示:

「這只是一個開始。」
Spotify CEO - Daniel Ek

Spotify CEO - Daniel Ek


Spotify一位發言人表示,這些是平台上用戶收聽播客最流行的語言之一,試點階段首先關注西班牙語,然後跟進德語和法語。

試聽看看吧

https://open.spotify.com/show/3vAfx8iwm4qszFeN5Qr014

raw-image


參考來源:

https://newsroom.spotify.com/2023-09-25/ai-voice-translation-pilot-lex-fridman-dax-shepard-steven-bartlett/

https://www.cnbc.com/2023/09/25/spotify-will-use-ai-to-replicate-and-translate-podcasters-voices.html

https://variety.com/2023/digital/news/spotify-ai-podcast-language-translation-1235732548/

留言
avatar-img
S'
39會員
97內容數
紀錄我認為值得一說的。
S'的其他內容
2025/01/17
自我在生物進化過程中,有好處嗎? 「你們有眼,但你們不看。」——拿撒勒的耶穌 「嘗試碰觸過去不實際。它只是一場夢。」 ——泰德·邦迪
Thumbnail
2025/01/17
自我在生物進化過程中,有好處嗎? 「你們有眼,但你們不看。」——拿撒勒的耶穌 「嘗試碰觸過去不實際。它只是一場夢。」 ——泰德·邦迪
Thumbnail
2024/12/03
真實還是真相? 青春、羅曼蒂克、山洞比喻、上帝之城、永恆、疏離、不可知論、圖書館、獨角獸、錢德勒、卡佛、海、深潭恐懼……十七歲的年紀,誰都不是誰。青春時刻不需要名字,連星辰大海都是心動絮語的鋪墊。女孩提起那座隱蔽小城,城就有了環圍的高牆。
Thumbnail
2024/12/03
真實還是真相? 青春、羅曼蒂克、山洞比喻、上帝之城、永恆、疏離、不可知論、圖書館、獨角獸、錢德勒、卡佛、海、深潭恐懼……十七歲的年紀,誰都不是誰。青春時刻不需要名字,連星辰大海都是心動絮語的鋪墊。女孩提起那座隱蔽小城,城就有了環圍的高牆。
Thumbnail
2024/11/21
自稱高敏感之人與高敏感者中間差了個瑞蒙.卡佛。 What we talk about when we talk about love ? 瑞蒙.卡佛專注於描寫那些百口莫辯、眾口難調、無以名狀的複雜語境。
Thumbnail
2024/11/21
自稱高敏感之人與高敏感者中間差了個瑞蒙.卡佛。 What we talk about when we talk about love ? 瑞蒙.卡佛專注於描寫那些百口莫辯、眾口難調、無以名狀的複雜語境。
Thumbnail
看更多
你可能也想看
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
創業者常因資金困境而無法抓住機會,利用房產活化讓二胎房貸成為財務策略的有力夥伴。 諮詢國峯厝好貸的二胎房貸服務,讓你的房子成為你最強力的天使投資人,推動事業成長。
Thumbnail
創業者常因資金困境而無法抓住機會,利用房產活化讓二胎房貸成為財務策略的有力夥伴。 諮詢國峯厝好貸的二胎房貸服務,讓你的房子成為你最強力的天使投資人,推動事業成長。
Thumbnail
又多一個 AI Podcast 生成工具|Google Gemini 正式整合 Spotify| xAI 擬推出獨立消費者應用
Thumbnail
又多一個 AI Podcast 生成工具|Google Gemini 正式整合 Spotify| xAI 擬推出獨立消費者應用
Thumbnail
OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音
Thumbnail
OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音
Thumbnail
聲音經濟 (Voice Economy) 是指以聲音為基礎的商業模式、技術與應用,用於創造價值和增加用戶體驗。藉由 AI改變聲音的創作、傳播與消費,將大幅改變人們與科技和品牌互動的方式。本文探討了AI世代包括虛擬語音助理、智慧音箱、文字生成語音和Podcast等不容忽視的市場數據和商業機會。
Thumbnail
聲音經濟 (Voice Economy) 是指以聲音為基礎的商業模式、技術與應用,用於創造價值和增加用戶體驗。藉由 AI改變聲音的創作、傳播與消費,將大幅改變人們與科技和品牌互動的方式。本文探討了AI世代包括虛擬語音助理、智慧音箱、文字生成語音和Podcast等不容忽視的市場數據和商業機會。
Thumbnail
結合AI技術的Adobe Podcast提供Enhance Speech和Mic Check兩項強大工具,可改善音訊品質。Enhance Speech消除背景雜訊、提升錄音品質,Mic Check提供專業麥克風設定建議。Remote功能讓多人遠端錄音無縫合作。
Thumbnail
結合AI技術的Adobe Podcast提供Enhance Speech和Mic Check兩項強大工具,可改善音訊品質。Enhance Speech消除背景雜訊、提升錄音品質,Mic Check提供專業麥克風設定建議。Remote功能讓多人遠端錄音無縫合作。
Thumbnail
Spotify推新AI功能,將podcast主持人的聲音翻譯成各國語言。
Thumbnail
Spotify推新AI功能,將podcast主持人的聲音翻譯成各國語言。
Thumbnail
Hi,大家好,我是茶桁。 其实到第18章的时候,我们处理文本的内容就全部都结束了,从本节课开始,我们要开始学习如何处理音频和图像。 我不知道有没有人和我一样的习性,就是比起视频和音频文件来说,还是跟喜欢看文本文件。这其中最主要的一个原因就是因为文本内容我们可以准确定位,而对于文本内容的接收速度还
Thumbnail
Hi,大家好,我是茶桁。 其实到第18章的时候,我们处理文本的内容就全部都结束了,从本节课开始,我们要开始学习如何处理音频和图像。 我不知道有没有人和我一样的习性,就是比起视频和音频文件来说,还是跟喜欢看文本文件。这其中最主要的一个原因就是因为文本内容我们可以准确定位,而对于文本内容的接收速度还
Thumbnail
多數人接收訊息、學習新知還是用「看」為主,但由於現今時間變得碎片化,不再像過往有完整的時間能夠集中專注在閱讀或學習一個主題,在這樣的趨勢下,我們的學習方式也必須隨之轉變,而這也是「聲音經濟」崛起的關鍵。 - 「聲音經濟」是什麼? - 為什麼用「聽」的學習方式會更快? - 一般人如何簡單運用 Cha
Thumbnail
多數人接收訊息、學習新知還是用「看」為主,但由於現今時間變得碎片化,不再像過往有完整的時間能夠集中專注在閱讀或學習一個主題,在這樣的趨勢下,我們的學習方式也必須隨之轉變,而這也是「聲音經濟」崛起的關鍵。 - 「聲音經濟」是什麼? - 為什麼用「聽」的學習方式會更快? - 一般人如何簡單運用 Cha
Thumbnail
你試用過人工智能(AI)文字轉語音功能了嗎? AI語音發展已經可高效地產出仿人聲語音,那麼,朗誦員、配音員的工作量是否會急遽減少呢? 現在爭議的問題點在於:業界人士發現有服務提供者混合市面上數種人聲錄音創造AI音頻,但沒有經過授權同意,侵害到原作者智慧財產權。 本篇文章介紹Google自動朗誦及AI
Thumbnail
你試用過人工智能(AI)文字轉語音功能了嗎? AI語音發展已經可高效地產出仿人聲語音,那麼,朗誦員、配音員的工作量是否會急遽減少呢? 現在爭議的問題點在於:業界人士發現有服務提供者混合市面上數種人聲錄音創造AI音頻,但沒有經過授權同意,侵害到原作者智慧財產權。 本篇文章介紹Google自動朗誦及AI
Thumbnail
在這個瞬息萬變的時代,數位行銷佔據著無比重要的地立。消費者如今更依賴網絡搜索、社交平台和手機應用程式。這樣的趨勢既為數位行銷帶來機遇,也帶來挑戰。要在這場競爭中脫穎而出,我們需要利用更加智能化的AI工具。
Thumbnail
在這個瞬息萬變的時代,數位行銷佔據著無比重要的地立。消費者如今更依賴網絡搜索、社交平台和手機應用程式。這樣的趨勢既為數位行銷帶來機遇,也帶來挑戰。要在這場競爭中脫穎而出,我們需要利用更加智能化的AI工具。
Thumbnail
TTS文字轉語音應用特色 1. TTS主要功能 將text文字檔的內容,轉換為wav檔,可送到Buffer,播放軟體可以讀取buffer做聲音後處理 能自動判斷前後文,自動判斷常用多音字、年份、日期、時間、電話、數字、%
Thumbnail
TTS文字轉語音應用特色 1. TTS主要功能 將text文字檔的內容,轉換為wav檔,可送到Buffer,播放軟體可以讀取buffer做聲音後處理 能自動判斷前後文,自動判斷常用多音字、年份、日期、時間、電話、數字、%
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News