【情報】佛心公司!OpenAI 發布最新語音模型,還可以免費下載音檔

更新 發佈閱讀 1 分鐘

哈囉,我是萊丘!歡迎回來

今天要跟大家分享OpenAI最新發布的三款語音模型,以及如何透過新網站OpenAI.fm免費體驗這些令人驚豔的功能!

OpenAI語音新模型介紹

2024年3月21日,OpenAI正式推出了基於全新GPT-4O架構的三款語音模型:

  • GPT-4O Transcribe:高效語音轉文字模型。
  • GPT-4O Mini Transcribe:輕量版語音轉文字模型,適合較簡單應用。
  • GPT-4O Mini TTS:文字轉語音(Text-to-Speech)模型,允許用戶更靈活地控制語音表現方式。

這些新模型到底有多強?根據OpenAI的官方數據,在多項測試中,GPT-4O Transcribe模型表現優於過去備受好評的Whisper模型,特別是在英文語音辨識上,其錯誤率僅達2.46%,不僅精確度極高,還支援超過100種語言,甚至能在噪音環境及多種口音中保持穩定辨識效果。


gpt-4o-transcribe 語音辨識錯誤率較上一版的 Whisper 模型進步。

gpt-4o-transcribe 語音辨識錯誤率較上一版的 Whisper 模型進步。


GPT-4O Transcribe模型實用功能

GPT-4O Transcribe的特色在於即時串流處理能力,透過這個技術,你可以像直播一樣持續輸入音頻,它將即時產生文字回應,讓人機對話更為流暢自然。

例如當你詢問:「嘿,我最後一筆訂單在哪?」AI會立刻回覆你的訂單詳細資訊,甚至能進一步回答訂單編號等具體問題,體驗上更加直觀且自然。

GPT-4O Mini TTS:可調整語音表現

這次另一個讓人驚艷的地方是GPT-4O Mini TTS模型,它能讓用戶自由地引導語音的表現方式。你不僅能指定要說什麼內容,還能決定語調、情境與風格。

透過官方提供的體驗網站OpenAI.fm,你可以自由選擇不同聲音(Voice)、情境氛圍(Vibe)與文本內容(Script)來快速生成語音。

raw-image


例如,我嘗試使用「大廚」的語音風格朗讀一段義大利料理介紹,聲音自然到讓我立刻聯想到網路上最近很紅的模仿川普的Tony,那種義大利口音十分生動且有趣!

此外,我也測試了中文文本,雖然目前中文語音生成的效果還有待提升,但仍可聽出明顯進步的潛力,整體辨識度和流暢度已經達到相當高的水準。

免費且可下載,輕鬆融入各種創作!

最重要的是,OpenAI.fm目前完全免費!過去使用ChatGPT語音功能時,並不提供下載選項,但現在你可以直接下載生成的音檔,無論是要放入短影音或是用於簡報、影片旁白,都十分方便!

小小建議與未來期待

儘管GPT-4O Mini TTS在中文表現上還有進步空間,但它在英文及其他語言中的表現確實驚人。不僅不同角色之間的音調切換自如,口音表現也相當逼真,未來發展潛力無窮。

如果喜歡這篇文章,歡迎留言鼓勵;也可以按下小愛心、訂閱我的文章。
YouTube頻道:萊丘Laichu_TV


留言
avatar-img
留言分享你的想法!
avatar-img
萊丘 LaichuTV的沙龍
69會員
39內容數
Hi 我是萊丘 這個專題主要發布創作相關軟體、硬體的「新聞、開箱、使用心得」影片
2025/03/16
Google Gemini 2.0 Flash 實測!五大超實用AI文生圖功能教學,取代Photoshop? 親身體驗包括更換圖片物件、改變動漫角色配色、更換人物配件、文字生成於物體表面和連續角色生成等,並分享使用心得與建議。 YouTube: 萊丘Laichu_TV
Thumbnail
2025/03/16
Google Gemini 2.0 Flash 實測!五大超實用AI文生圖功能教學,取代Photoshop? 親身體驗包括更換圖片物件、改變動漫角色配色、更換人物配件、文字生成於物體表面和連續角色生成等,並分享使用心得與建議。 YouTube: 萊丘Laichu_TV
Thumbnail
2025/03/08
UPDF 是一款整合深度AI技術的PDF處理神器,價格低廉,功能強大,支援跨平臺應用。本文詳細介紹UPDF的AI應用場景、筆記編輯、AI功能、素材編輯、頁面編輯與輸出、跨設備雲端同步等功能。UPDF 能夠自動生成文章摘要、思維導圖,支援跨語言圖文解析、多模型切換,並提供全文摘要、心智圖生成等功能。
Thumbnail
2025/03/08
UPDF 是一款整合深度AI技術的PDF處理神器,價格低廉,功能強大,支援跨平臺應用。本文詳細介紹UPDF的AI應用場景、筆記編輯、AI功能、素材編輯、頁面編輯與輸出、跨設備雲端同步等功能。UPDF 能夠自動生成文章摘要、思維導圖,支援跨語言圖文解析、多模型切換,並提供全文摘要、心智圖生成等功能。
Thumbnail
2025/02/07
提升自我成長的最佳途徑:透過Libby免費借閱電子書和有聲書,拓展思考框架,提升技能,並結合個人「人生升級系統」,逐步達成目標。
Thumbnail
2025/02/07
提升自我成長的最佳途徑:透過Libby免費借閱電子書和有聲書,拓展思考框架,提升技能,並結合個人「人生升級系統」,逐步達成目標。
Thumbnail
看更多
你可能也想看
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
OpenAI 春季發布會推出了 GPT-4o 模型,免費且響應速度更快,具備文字、音訊、影像的多模態輸入功能。
Thumbnail
OpenAI 春季發布會推出了 GPT-4o 模型,免費且響應速度更快,具備文字、音訊、影像的多模態輸入功能。
Thumbnail
OpenAI在5/13春季發表會上宣佈,將免費向ChatGPT推出最新的GPT-4o模型和更多功能。免費用戶將可享受GPT-4o的智慧和高級工具,並有使用量限制。文章介紹了GPT-4o的功能和未來優化,並提到新的ChatGPT桌面應用程式和外觀改變。
Thumbnail
OpenAI在5/13春季發表會上宣佈,將免費向ChatGPT推出最新的GPT-4o模型和更多功能。免費用戶將可享受GPT-4o的智慧和高級工具,並有使用量限制。文章介紹了GPT-4o的功能和未來優化,並提到新的ChatGPT桌面應用程式和外觀改變。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
ChatGPT新模型GPT-4o即將推出,速度更快,並支援處理影片以及多種語言。免費用戶也可以使用ChatBots,而付費版本則限制頻寬並提高至原本的5倍。此外,還將推出ChatGPT桌面應用程式,讓使用者在電腦上進行各項工作時,更輕鬆地使用ChatGPT。
Thumbnail
ChatGPT新模型GPT-4o即將推出,速度更快,並支援處理影片以及多種語言。免費用戶也可以使用ChatBots,而付費版本則限制頻寬並提高至原本的5倍。此外,還將推出ChatGPT桌面應用程式,讓使用者在電腦上進行各項工作時,更輕鬆地使用ChatGPT。
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News