AI語音技術最新進展：ElevenLabs Eleven v3 (alpha) 與 ChatGPT 進階語音模式

2025/06/10 更新2025/06/10 發佈閱讀 4 分鐘

ElevenLabs 於2025年6月3日推出其最新模型 Eleven v3（Alpha版），與此同時，ChatGPT 也於2025年6月7日針對付費用戶升級進階語音模式（Advanced Voice Mode），均展現了AI語音在自然度、情感表達及多語言應用上的巨大進步。TN科技筆記將於本篇文章為各位介紹這兩家公司在 AI 語音上的更新特色，幫助讀者了解 AI 語音的最新應用趨勢！

ElevenLabs Eleven v3 (alpha) ：情感豐富的多語言 AI 語音

ElevenLabs 這款文字轉語音（Text-to-Speech）模型 Eleven v3 (alpha) 透過新增的音頻標籤功能，如「[竊竊私語]」、「[興奮]」、「[笑聲]」及「[嘆息]」：

“[whispers] Something’s coming… [sighs] I can feel it.”

讓用戶可精準控制語音的情感變化，甚至在單句中實現語氣轉換。此外，Eleven v3 (alpha) 推出文字對話API（Text to Dialogue API），支援多角色對話模擬，模擬真實交談中的語氣重疊與情感細膩度，特別適用於有聲書、遊戲配音及多語言故事創作。

在語言支援方面，Eleven v3 從原本的33種語言擴展至超過70種，新增如印地語、泰米爾語及孟加拉語等，顯著提升其全球化應用潛力。該模型目前已在elevenlabs.io上線，API 則即將推出。對於需要預渲染的創意內容，如角色驅動的故事或專業旁白，v3 表現尤為出色，但即時應用仍以 v2.5 Turbo 及 Flash 模型為主，v3 即時版本仍在開發中。

Introducing Eleven v3 (alpha) — Our Most Expressive Text to Speech Model

ChatGPT 進階語音模式：更自然的對話與即時翻譯

OpenAI 近期則針對 ChatGPT 付費用戶升級進階語音模式，進一步改進語音的自然度與語調表現。更新後的語音模式在語調、停頓及情感表達（如同理心、諷刺等）上更加細膩，使對話更接近真人互動。其中特別值得一提的是，其新增的即時語言翻譯功能，用戶只需啟動語音模式並指定語言，ChatGPT 即可在對話中持續翻譯。例如，在巴西餐廳點餐時，語音模式能將英文指令翻譯成葡萄牙語，並將服務員的回應翻譯回英文，大幅提升跨語言溝通的便利性。

該功能適用於所有付費用戶，無需額外設定即可透過訊息輸入框中的語音圖標啟用。然而，OpenAI 也指出，部分語音選項可能出現音質不穩或語調變化的問題，偶爾甚至會產生類似廣告或背景音樂的「幻聽」現象。這些問題正在積極修復中，預計未來將進一步提升語音穩定性。

ElevenLabs v3 與 ChatGPT 進階語音模式的推出，可見 AI語音技術在情感表達、多語言支援及即時應用上的持續突破。無論是創作者還是企業用戶，這些工具都提供了前所未有的可能性，讓我們一起期待更多不同的 AI 語音應用出現吧！

我是TN科技筆記，如果喜歡這篇文章，歡迎留言、點選愛心、轉發給我支持鼓勵～～～也歡迎每個月請我喝杯咖啡，鼓勵我撰寫更多科技文章，一起跟著科技浪潮前進！！>>>請我喝一杯咖啡

TN科技筆記(TechNotes)的沙龍科技領域筆記

留言

TN科技筆記(TechNotes)的沙龍

72會員

240內容數

大家好，我是TN，喜歡分享科技領域相關資訊，希望各位不吝支持與交流！

TN科技筆記(TechNotes)的沙龍的其他內容

2025/06/07

Gemini 2.5 Pro 更新版本 Preview 06-05 Thinking：迄今最強的AI助手

Google 於2025年6月5日推出了 Gemini 2.5 Pro Preview 06-05 Thinking ，這款被譽為 Google 迄今最智能的AI模型，帶來了令人矚目的功能改進。TN科技筆記將帶領各位介紹這款模型的特色、效能表現及應用場景。

2025/06/07

Gemini 2.5 Pro 更新版本 Preview 06-05 Thinking：迄今最強的AI助手

2025/06/06

Meta Aria Gen 2 ：AI 智慧眼鏡的未來逐漸展開

2025 年 6 月 4 日，Meta AI 釋出了更多關於 Aria Gen 2 的深入技術細節，這款智慧眼鏡最初於今年 2 月份的發表會上驚艷亮相，TN科技筆記將為各位介紹 Aria Gen 2 的核心功能、應用場景及其對未來科技的可能影響。

2025/06/06

Meta Aria Gen 2 ：AI 智慧眼鏡的未來逐漸展開

2025/06/04

FLUX.1 Kontext：AI 圖像生成與編輯的最新突破

2025年5月29日，Black Forest Labs 正式發布了 FLUX.1 Kontext，這是一款有如瑞士刀般多功能的 AI 圖像生成與編輯模型套件。相較於傳統的文字到圖像模型，FLUX.1 Kontext 引入了情境圖像生成（in-context image generation）

2025/06/04

FLUX.1 Kontext：AI 圖像生成與編輯的最新突破

#AI 的其他內容

AI盛行下，我卻感受到「老派」設計的浪漫。

方格子 vocus 官方沙龍

【4月靈感產生器】TOP 100 關鍵字：「○○」格友最愛用

賴仕涵的思考王國

💖當「我的女朋友叫GEMINI」成為公開認同：台視【熱線追蹤】觀後感

你可能也想看

生命剪輯師的沙龍

面對AI的進化

遇到故障申告或客服問題時，經常需要與語音系統對話，但這樣的狀況只會越來越多。這篇文章描述了作者與AI語音系統的故障申告對話過程，以及對未來科技與人性關係的思考。作者透過個人經驗探討了人與機器的互動，以及可能面臨的情感抽離和機械化。透過文章，探討了AI是否在訓練和影響人類，最終進化人類的人性。

2024/07/04

2024/07/04

GPT工作術｜與你一起補給工作的AI能量沙龍

什麼是「Voice Cloning」？ AI擬聲的影響與爭議

OpenAI近期公開了名為「Voice Engine（語音引擎）」的AI模型，使用者只要輸入文字與15秒的音訊樣本，該模型便會自動生成與原說話者相似的語音訊息。AI擬聲，也就是大家常說的聲音克隆（Voice Cloning），這項技術發展迅速，讓我們可以輕易複製一個人的聲音，產生合成語音

#智慧財產權#法律#OpenAI

2024/04/08

GPT工作術｜與你一起補給工作的AI能量沙龍

什麼是「Voice Cloning」？ AI擬聲的影響與爭議

#智慧財產權#法律#OpenAI

2024/04/08

GPT工作術｜與你一起補給工作的AI能量沙龍

Vtuber、NPC、Avatar和數位分身，AI的發展暗示了什麼？

Character.AI發佈新功能Character Voice，nVidia在GTC 2024也介紹與Ubisoft巴黎工作室合作的NEO NPC專案，OpenAI註冊了「voice engine」和「digital voice assistants」這兩商標，到底暗示了什麼AI發展趨勢？

#Ubisoft#角色#互動

2024/03/26

GPT工作術｜與你一起補給工作的AI能量沙龍

Vtuber、NPC、Avatar和數位分身，AI的發展暗示了什麼？

#Ubisoft#角色#互動

2024/03/26

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

這是一場修復文化與重建精神的儀式，觀眾不需要完全看懂《遊林驚夢：巧遇Hagay》，但你能感受心與土地團聚的渴望，也不急著在此處釐清或定義什麼，但你的在場感受，就是一條線索，關於如何找著自己的路徑、自己的聲音。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

黃郁書的沙龍

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》，由臺灣劇團「晃晃跨幅町」製作，本文將以從舞台符號、聲音與表演調度切入，討論海妲・蓋柏樂在父權社會結構下的困境，並結合榮格心理學與馮．法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析，理解女人何以走向精神性的操控、毀滅與死亡。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

黃郁書的沙龍

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

shhsuan_day的沙龍

AI工具｜文字自動生成語音

之前有寫過一篇《AI工具│透過AI整合的語音功能 Murf》，近期使用過之後，隨著ChatGPT與相關AI普及之後，新的自動生成網站與工具變得多元了起來。大多會使用在影片製作中，若缺少的素材，或是想要呈現事件及詼諧感的時候，會加入片段人聲去做效果。於是決定，統整一下自己最近常用的4個AI語

2024/03/21

2024/03/21

解放創意與生產力，2024 好用的生成式AI工具

這篇文章整理了多種好用的AI工具，涵蓋了聲音與音樂相關的AI、影音、圖像生成編輯工具和AI搜尋引擎等領域，幫助你節省時間和解放創意與生產力。

#ChatGPT#Podcast#OpenAI

2024/03/18

IEO 國際財經科技前沿觀察

解放創意與生產力，2024 好用的生成式AI工具

這篇文章整理了多種好用的AI工具，涵蓋了聲音與音樂相關的AI、影音、圖像生成編輯工具和AI搜尋引擎等領域，幫助你節省時間和解放創意與生產力。

#ChatGPT#Podcast#OpenAI

2024/03/18

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11