AI語音技術最新進展:ElevenLabs Eleven v3 (alpha) 與 ChatGPT 進階語音模式

更新於 發佈於 閱讀時間約 4 分鐘

ElevenLabs 於2025年6月3日推出其最新模型 Eleven v3(Alpha版),與此同時,ChatGPT 也於2025年6月7日針對付費用戶升級進階語音模式(Advanced Voice Mode),均展現了AI語音在自然度、情感表達及多語言應用上的巨大進步。TN科技筆記將於本篇文章為各位介紹這兩家公司在 AI 語音上的更新特色,幫助讀者了解 AI 語音的最新應用趨勢!

ElevenLabs Eleven v3 (alpha) :情感豐富的多語言 AI 語音

ElevenLabs 這款文字轉語音(Text-to-Speech)模型 Eleven v3 (alpha) 透過新增的音頻標籤功能,如「[竊竊私語]」、「[興奮]」、「[笑聲]」及「[嘆息]」:

[whispers] Something’s coming… [sighs] I can feel it.

讓用戶可精準控制語音的情感變化,甚至在單句中實現語氣轉換。此外,Eleven v3 (alpha) 推出文字對話API(Text to Dialogue API),支援多角色對話模擬,模擬真實交談中的語氣重疊與情感細膩度,特別適用於有聲書、遊戲配音及多語言故事創作。

在語言支援方面,Eleven v3 從原本的33種語言擴展至超過70種,新增如印地語、泰米爾語及孟加拉語等,顯著提升其全球化應用潛力。該模型目前已在elevenlabs.io上線,API 則即將推出。對於需要預渲染的創意內容,如角色驅動的故事或專業旁白,v3 表現尤為出色,但即時應用仍以 v2.5 Turbo 及 Flash 模型為主,v3 即時版本仍在開發中。

raw-image

Introducing Eleven v3 (alpha) — Our Most Expressive Text to Speech Model

ChatGPT 進階語音模式:更自然的對話與即時翻譯

OpenAI 近期則針對 ChatGPT 付費用戶升級進階語音模式,進一步改進語音的自然度與語調表現。更新後的語音模式在語調、停頓及情感表達(如同理心、諷刺等)上更加細膩,使對話更接近真人互動。其中特別值得一提的是,其新增的即時語言翻譯功能,用戶只需啟動語音模式並指定語言,ChatGPT 即可在對話中持續翻譯。例如,在巴西餐廳點餐時,語音模式能將英文指令翻譯成葡萄牙語,並將服務員的回應翻譯回英文,大幅提升跨語言溝通的便利性。

該功能適用於所有付費用戶,無需額外設定即可透過訊息輸入框中的語音圖標啟用。然而,OpenAI 也指出,部分語音選項可能出現音質不穩或語調變化的問題,偶爾甚至會產生類似廣告或背景音樂的「幻聽」現象。這些問題正在積極修復中,預計未來將進一步提升語音穩定性。


ElevenLabs v3 與 ChatGPT 進階語音模式的推出,可見 AI語音技術在情感表達、多語言支援及即時應用上的持續突破。無論是創作者還是企業用戶,這些工具都提供了前所未有的可能性,讓我們一起期待更多不同的 AI 語音應用出現吧!

我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>請我喝一杯咖啡

留言
avatar-img
留言分享你的想法!
avatar-img
TN科技筆記(TechNotes)的沙龍
29會員
114內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/06/07
Google 於2025年6月5日推出了 Gemini 2.5 Pro Preview 06-05 Thinking ,這款被譽為 Google 迄今最智能的AI模型,帶來了令人矚目的功能改進。TN科技筆記將帶領各位介紹這款模型的特色、效能表現及應用場景。
Thumbnail
2025/06/07
Google 於2025年6月5日推出了 Gemini 2.5 Pro Preview 06-05 Thinking ,這款被譽為 Google 迄今最智能的AI模型,帶來了令人矚目的功能改進。TN科技筆記將帶領各位介紹這款模型的特色、效能表現及應用場景。
Thumbnail
2025/06/06
2025 年 6 月 4 日,Meta AI 釋出了更多關於 Aria Gen 2 的深入技術細節,這款智慧眼鏡最初於今年 2 月份的發表會上驚艷亮相,TN科技筆記將為各位介紹 Aria Gen 2 的核心功能、應用場景及其對未來科技的可能影響。
Thumbnail
2025/06/06
2025 年 6 月 4 日,Meta AI 釋出了更多關於 Aria Gen 2 的深入技術細節,這款智慧眼鏡最初於今年 2 月份的發表會上驚艷亮相,TN科技筆記將為各位介紹 Aria Gen 2 的核心功能、應用場景及其對未來科技的可能影響。
Thumbnail
2025/06/04
2025年5月29日,Black Forest Labs 正式發布了 FLUX.1 Kontext,這是一款有如瑞士刀般多功能的 AI 圖像生成與編輯模型套件。相較於傳統的文字到圖像模型,FLUX.1 Kontext 引入了情境圖像生成(in-context image generation)
Thumbnail
2025/06/04
2025年5月29日,Black Forest Labs 正式發布了 FLUX.1 Kontext,這是一款有如瑞士刀般多功能的 AI 圖像生成與編輯模型套件。相較於傳統的文字到圖像模型,FLUX.1 Kontext 引入了情境圖像生成(in-context image generation)
Thumbnail
看更多
你可能也想看
Thumbnail
孩子寫功課時瞇眼?小心近視!這款喜光全光譜TIONE⁺光健康智慧檯燈,獲眼科院長推薦,網路好評不斷!全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉,讓孩子學習更舒適、保護眼睛!
Thumbnail
孩子寫功課時瞇眼?小心近視!這款喜光全光譜TIONE⁺光健康智慧檯燈,獲眼科院長推薦,網路好評不斷!全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉,讓孩子學習更舒適、保護眼睛!
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
遇到故障申告或客服問題時,經常需要與語音系統對話,但這樣的狀況只會越來越多。這篇文章描述了作者與AI語音系統的故障申告對話過程,以及對未來科技與人性關係的思考。作者透過個人經驗探討了人與機器的互動,以及可能面臨的情感抽離和機械化。透過文章,探討了AI是否在訓練和影響人類,最終進化人類的人性。
Thumbnail
遇到故障申告或客服問題時,經常需要與語音系統對話,但這樣的狀況只會越來越多。這篇文章描述了作者與AI語音系統的故障申告對話過程,以及對未來科技與人性關係的思考。作者透過個人經驗探討了人與機器的互動,以及可能面臨的情感抽離和機械化。透過文章,探討了AI是否在訓練和影響人類,最終進化人類的人性。
Thumbnail
  在 AI 應用中,圖像、語音、文字三種可以說是主要應用,其中我一直以來都是專注於圖像上的研究,對於另兩種僅止於淺嚐,接下來就往音訊上研究看看,先從入門級的Text-To-Speech (TTL) 入場並一個個嘗試其他類型的應用,那麼,就讓我們開始吧。
Thumbnail
  在 AI 應用中,圖像、語音、文字三種可以說是主要應用,其中我一直以來都是專注於圖像上的研究,對於另兩種僅止於淺嚐,接下來就往音訊上研究看看,先從入門級的Text-To-Speech (TTL) 入場並一個個嘗試其他類型的應用,那麼,就讓我們開始吧。
Thumbnail
ChatGPT(全名:聊天生成預訓練轉換器)是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出,使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型,並以強化學習進行訓練。
Thumbnail
ChatGPT(全名:聊天生成預訓練轉換器)是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出,使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型,並以強化學習進行訓練。
Thumbnail
OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音
Thumbnail
OpenAI近期公開了名為「Voice Engine(語音引擎)」的AI模型,使用者只要輸入文字與15秒的音訊樣本,該模型便會自動生成與原說話者相似的語音訊息。AI擬聲,也就是大家常說的聲音克隆(Voice Cloning),這項技術發展迅速,讓我們可以輕易複製一個人的聲音,產生合成語音
Thumbnail
Character.AI發佈新功能Character Voice,nVidia在GTC 2024也介紹與Ubisoft巴黎工作室合作的NEO NPC專案,OpenAI註冊了「voice engine」和「digital voice assistants」這兩商標,到底暗示了什麼AI發展趨勢?
Thumbnail
Character.AI發佈新功能Character Voice,nVidia在GTC 2024也介紹與Ubisoft巴黎工作室合作的NEO NPC專案,OpenAI註冊了「voice engine」和「digital voice assistants」這兩商標,到底暗示了什麼AI發展趨勢?
Thumbnail
之前有寫過一篇 《AI工具│透過AI整合的語音功能 Murf》,近期使用過之後,隨著ChatGPT與相關AI普及之後,新的自動生成網站與工具變得多元了起來。 大多會使用在影片製作中,若缺少的素材,或是想要呈現事件及詼諧感的時候,會加入片段人聲去做效果。 於是決定,統整一下自己最近常用的4個AI語
Thumbnail
之前有寫過一篇 《AI工具│透過AI整合的語音功能 Murf》,近期使用過之後,隨著ChatGPT與相關AI普及之後,新的自動生成網站與工具變得多元了起來。 大多會使用在影片製作中,若缺少的素材,或是想要呈現事件及詼諧感的時候,會加入片段人聲去做效果。 於是決定,統整一下自己最近常用的4個AI語
Thumbnail
這篇文章整理了多種好用的AI工具,涵蓋了聲音與音樂相關的AI、影音、圖像生成編輯工具和AI搜尋引擎等領域,幫助你節省時間和解放創意與生產力。
Thumbnail
這篇文章整理了多種好用的AI工具,涵蓋了聲音與音樂相關的AI、影音、圖像生成編輯工具和AI搜尋引擎等領域,幫助你節省時間和解放創意與生產力。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
2023年底以來,語言模型發展面臨著價格上漲、更新減緩和公司內部變動的局面,這些變化似乎意味著語言模型的發展受到了人為的控制和限制。
Thumbnail
2023年底以來,語言模型發展面臨著價格上漲、更新減緩和公司內部變動的局面,這些變化似乎意味著語言模型的發展受到了人為的控制和限制。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News