Spotify聯手OpenAI

閱讀時間約 2 分鐘

摘要:

Spotify推新AI功能,將podcast主持人的聲音翻譯成各國語言。

  • Spotify於9/25宣布推出新的人工智慧功能,該功能可保留主持人聲音特徵將播客內容翻成各國語言。
  • Spotify表示,該功能依賴於ChatGPT,該更新也在週一宣布(見文末試聽連結)。
  • OpenAI在一份聲明中表示,該技術可以僅使用幾秒鐘的語音就創建「逼真的合成聲音」。
raw-image

內文:

Spotify於週一(9/25)宣布推出新的人工智慧功能,可使用主持人自己的聲音將播客翻譯成不同語言。該公司表示,該功能依賴於OpenAI的語音生成技術,這技術可以僅使用幾秒鐘的語音創建「逼真的合成聲音」。

Spotify表示,該功能將有助於保持播客者的「獨特發音特徵」,從而使播客收聽體驗更加真實和自然。

Spotify與Dax Shepard、Lex Fridman、Monica Padman、Steven Bartlett和Bill Simmons等播客合作製作了一系列過去和即將推出的節目。該公司表示,這些節目最初被翻譯成西班牙語、法語和德語,並將在未來幾天和幾週內提供給免費用戶和付費訂閱用戶。

Spotify 目前表示,其全球範圍內有超過 1 億播客聽眾,並在 170 多個市場提供超過 500 萬個播客標題。根據 Edison Research 的數據,該公司是 2022 年第四季度至 2023 年第二季度基於覆蓋範圍的最大美國播客網絡。

Spotify沒有向CNBC透露新功能的具體成本。一位發言人補充說,該公司正在探索「向全球更多播客提供這項服務」的機會。例如,該公司已經在開發喜劇演員Trevor Noah即將推出的新播客。

Spotify在新聞稿中表示:

「這只是一個開始。」
Spotify CEO - Daniel Ek

Spotify CEO - Daniel Ek


Spotify一位發言人表示,這些是平台上用戶收聽播客最流行的語言之一,試點階段首先關注西班牙語,然後跟進德語和法語。

試聽看看吧

https://open.spotify.com/show/3vAfx8iwm4qszFeN5Qr014

raw-image


參考來源:

https://newsroom.spotify.com/2023-09-25/ai-voice-translation-pilot-lex-fridman-dax-shepard-steven-bartlett/

https://www.cnbc.com/2023/09/25/spotify-will-use-ai-to-replicate-and-translate-podcasters-voices.html

https://variety.com/2023/digital/news/spotify-ai-podcast-language-translation-1235732548/

avatar-img
29會員
75內容數
紀錄我認為值得一說的。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
S' 的其他內容
來自 Marc Whitten (Unity CEO)的致歉 !
這個被稱為二十世紀最博學的人,若在荒島用五本書度過餘生,他會選哪五本書呢? 而略薩又是誰?
「光就像水,你一扭開龍頭,它就出來了。」 要成為在流光中永恆的孩子,還是在光海下的大人?
你得到了語言,騙人的東西, 你得到了肉體,無非是一堆塵土, 你得到淫穢的噩夢, 以及在鏡子裡瞅著我們的另一個人。
來自 Marc Whitten (Unity CEO)的致歉 !
這個被稱為二十世紀最博學的人,若在荒島用五本書度過餘生,他會選哪五本書呢? 而略薩又是誰?
「光就像水,你一扭開龍頭,它就出來了。」 要成為在流光中永恆的孩子,還是在光海下的大人?
你得到了語言,騙人的東西, 你得到了肉體,無非是一堆塵土, 你得到淫穢的噩夢, 以及在鏡子裡瞅著我們的另一個人。
你可能也想看
Google News 追蹤
Thumbnail
又多一個 AI Podcast 生成工具|Google Gemini 正式整合 Spotify| xAI 擬推出獨立消費者應用
Thumbnail
▌Spotify 正在將有聲書體驗改造得更像是短影音 ▌ #葉郎每日讀報 #快讀版 20241122 →報導摘錄→ Techcrunch:「有聲書短影音功能的推出符合近來 Spotify 對影片格式持續投入的趨勢。該平台上的影片消費正在快速普及,尤其是在音樂影片和 podcast 影片等產
7月31日,OpenAI在其官方媒体账号上表示,开始向一小部分ChatGPT Plus用户推出高级语音模式。 当前,实时响应和可打断对话是公认的语音助手技术难点。而据OpenAI介绍,其推出的高级语音模式可以提供更自然的实时对话,允许用户随时打断,并能感知和响应用户的情绪。 此前,ChatGPT
Thumbnail
今天要和大家分享我常用來收聽 Podcast 的 Apple Podcast 和 Spotify Podcast 兩個平台,它們都結合了 AI 強大的辨識功能,讓 Podcast 開始擁有新功能 — 即時逐字稿。倘若你錯過了某段話或想重溫某個片段,可以使用即時逐字稿功能,快速且直接選擇想聆聽的段落。
Thumbnail
本週 AI 趨勢帶來了三個超酷的黑科技,包括語言翻譯耳機、AI 教練和 AI 音樂製作工具。這些創新科技幫助解決語言溝通、健身指導和音樂創作等問題,是數據、人工智慧和科技的未來。快來瞭解如何應用這些科技,打造更豐富的生活體驗吧!
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音
不囉嗦,先看成果,這是用我的聲音翻唱 Andy Williams的 Speak softly love (原唱連結) 作法步驟如下: 準備好原唱的聲音檔。 可利用人聲/樂聲分離工具 vocal remover https://vocalremover.org/ (這是目前網上最好的免費分離工
Thumbnail
聲音經濟 (Voice Economy) 是指以聲音為基礎的商業模式、技術與應用,用於創造價值和增加用戶體驗。藉由 AI改變聲音的創作、傳播與消費,將大幅改變人們與科技和品牌互動的方式。本文探討了AI世代包括虛擬語音助理、智慧音箱、文字生成語音和Podcast等不容忽視的市場數據和商業機會。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
又多一個 AI Podcast 生成工具|Google Gemini 正式整合 Spotify| xAI 擬推出獨立消費者應用
Thumbnail
▌Spotify 正在將有聲書體驗改造得更像是短影音 ▌ #葉郎每日讀報 #快讀版 20241122 →報導摘錄→ Techcrunch:「有聲書短影音功能的推出符合近來 Spotify 對影片格式持續投入的趨勢。該平台上的影片消費正在快速普及,尤其是在音樂影片和 podcast 影片等產
7月31日,OpenAI在其官方媒体账号上表示,开始向一小部分ChatGPT Plus用户推出高级语音模式。 当前,实时响应和可打断对话是公认的语音助手技术难点。而据OpenAI介绍,其推出的高级语音模式可以提供更自然的实时对话,允许用户随时打断,并能感知和响应用户的情绪。 此前,ChatGPT
Thumbnail
今天要和大家分享我常用來收聽 Podcast 的 Apple Podcast 和 Spotify Podcast 兩個平台,它們都結合了 AI 強大的辨識功能,讓 Podcast 開始擁有新功能 — 即時逐字稿。倘若你錯過了某段話或想重溫某個片段,可以使用即時逐字稿功能,快速且直接選擇想聆聽的段落。
Thumbnail
本週 AI 趨勢帶來了三個超酷的黑科技,包括語言翻譯耳機、AI 教練和 AI 音樂製作工具。這些創新科技幫助解決語言溝通、健身指導和音樂創作等問題,是數據、人工智慧和科技的未來。快來瞭解如何應用這些科技,打造更豐富的生活體驗吧!
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音
不囉嗦,先看成果,這是用我的聲音翻唱 Andy Williams的 Speak softly love (原唱連結) 作法步驟如下: 準備好原唱的聲音檔。 可利用人聲/樂聲分離工具 vocal remover https://vocalremover.org/ (這是目前網上最好的免費分離工
Thumbnail
聲音經濟 (Voice Economy) 是指以聲音為基礎的商業模式、技術與應用,用於創造價值和增加用戶體驗。藉由 AI改變聲音的創作、傳播與消費,將大幅改變人們與科技和品牌互動的方式。本文探討了AI世代包括虛擬語音助理、智慧音箱、文字生成語音和Podcast等不容忽視的市場數據和商業機會。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。