OpenAI 推出 ChatGPT 網頁版語音功能!改變人機互動的方式

閱讀時間約 3 分鐘

OpenAI 最新推出的 ChatGPT 語音功能,現已在網頁版可用,為人機互動帶來全新高度的自然度與便利性。無論是語言學習、日常輔助,還是個人化陪伴,這項功能都能模擬真實對話場景,提供更加沉浸的互動體驗。

語音輸入與回應,突破傳統溝通方式

ChatGPT 的語音功能基於 GPT-4o 模型,讓使用者可以透過語音與 AI 交流,徹底改變以往只能依賴文字的溝通模式。此功能分為兩部分:

語音輸入

使用者可直接對 ChatGPT 說話,系統會自動將語音轉換為文字,並基於此生成回應。不僅操作簡單,還支援多語言,成為跨文化交流的便利工具。

語音回應

除了傳統的文字回覆,ChatGPT 現在能以自然流暢的語音方式回應,用戶彷彿與真人對話般舒適自如,模擬了真實的交流情境,適合陪伴與學習。

如何使用 ChatGPT 的語音功能?

目前,ChatGPT 的進階語音模式已在網頁版上線,現階段提供給付費方案使用,OpenAI 表示,預計再幾個禮拜會推向免費用戶。

步驟一:選擇 ChatGPT 4o 模型

在網頁版 ChatGPT,點擊輸入框右側的「音訊」圖示。

raw-image

步驟二:授權麥克風

第一次使用時,系統會要求授權麥克風權限。點擊「允許」後,即可開始與 ChatGPT 進行語音對話。

raw-image

步驟三:語音對話過程

當你開始對話結束時,系統會顯示「對話泡泡」符號,代表 AI 正在思考。

raw-image

步驟四:語音回應

ChatGPT 以語音方式回應時,會看到畫面出現「音訊」的圖示

raw-image

步驟五:回顧對話記錄

完成對話後,系統將顯示交談時間及完整的對話記錄,方便使用者回顧或整理,在文字準確度我覺得算蠻高的。

raw-image

應用場景:讓語音功能成為生活好助手

語言學習

對於語言學習者而言,ChatGPT 提供了理想的練習環境,使用者可以進行口語對話,練習發音、聽力與日常溝通,模擬真實場景如點餐、購物或問路。此外,系統支持多語言輸入,讓使用者隨時隨地練習外語。

raw-image
raw-image

陪伴與互動:AI 變身個人化夥伴

語音功能讓 ChatGPT 不再只是文字工具,而是可以隨時隨地陪伴用戶的 AI 夥伴。無論是討論日常問題、緩解孤單,還是純粹聊天,這項功能都能提供互動,但比較可惜的是沒辦法像人類一樣有情感。

raw-image

現階段限制

  • 情感表達仍有不足: 雖然語音回應自然流暢,但情感模擬尚不完全。
  • 無法提供即時資訊: 例如查詢當地天氣或即時新聞,ChatGPT 無法實時回應。
raw-image

總結

ChatGPT 的語音功能不僅提升了人機互動的自然度,也為多樣化的應用場景打開了大門。無論是日常使用、學習進修,還是工作效率提升,這項技術都能帶來嶄新的體驗。快來試試,感受與 AI 語音對話的樂趣吧!

avatar-img
216會員
123內容數
主要是介紹各種AI工具,讓你輕鬆學會並應用,無論是圖像生成、文字編輯還是影片創作,這些工具都能事半功倍,為你節省寶貴時間,同時激發無限創意。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Felo AI 是一款創新的人工智慧工具,專為幫助使用者快速搜尋和生成簡報而設計。本文將介紹透過 Felo 製作簡報的詳細步驟,從語系設置到簡報下載,讓使用者能以更高效率創建專業質感的簡報。Felo 不僅節省時間,還提供即時更新的資料和多樣化的設計選擇,讓簡報製作變得輕鬆且高效。
本文將教你如何在Chrome瀏覽器中安裝ChatGPT Search外掛,並手動設定多個搜尋引擎如Perplexity和Felo。只需簡單的步驟,便可在搜尋欄中靈活切換不同的搜尋引擎,享受更高效的搜尋體驗。無論是想使用ChatGPT還是其他AI服務,這篇指南都能助你快速上手,提升搜尋效率。
ChatGPT Search 是一項由 OpenAI 開發的新功能,能使 ChatGPT 從網路即時獲取最新資訊,提升回答的準確性與即時性。此功能方便用戶查詢最新新聞、天氣和股票價格,並提高寫作及創作效率。運用簡單的搜尋方式,使用者即可得到可靠的資料,精準引用並增強內容的可信度。
Felo Search 是 2024 年推出的智慧搜尋工具,支援多語言和跨語言搜尋,適合日常查詢和學術研究。Felo Search 提供免費和付費版,免費版適合日常使用,付費版能提供更深入的答案,Felo AI 無廣告且能生成思維導圖,讓搜尋過程更專注高效,是非英語使用者接觸全球知識的理想工具。
ChatGPT Canvas 是基於 GPT-4o 模型的全新動態界面,旨在提升寫作與程式開發的效率。它不僅提供智能編輯和寫作輔助功能,還支持程式碼轉換和錯誤修復,讓用戶能在更靈活的環境中創作。這篇文章介紹了 Canvas 的核心功能和使用流程,幫助使用者更好地瞭解如何利用此工具提升創作質量與效率。
Anthropic AI推出的Claude 3.5 Sonnet NLP模型提供卓越性能和強大的功能。透過本文,您將瞭解到Claude 3.5 Sonnet的特點、費用、操作說明,並透過實作範例深入瞭解其在程式設計方面的能力。
Felo AI 是一款創新的人工智慧工具,專為幫助使用者快速搜尋和生成簡報而設計。本文將介紹透過 Felo 製作簡報的詳細步驟,從語系設置到簡報下載,讓使用者能以更高效率創建專業質感的簡報。Felo 不僅節省時間,還提供即時更新的資料和多樣化的設計選擇,讓簡報製作變得輕鬆且高效。
本文將教你如何在Chrome瀏覽器中安裝ChatGPT Search外掛,並手動設定多個搜尋引擎如Perplexity和Felo。只需簡單的步驟,便可在搜尋欄中靈活切換不同的搜尋引擎,享受更高效的搜尋體驗。無論是想使用ChatGPT還是其他AI服務,這篇指南都能助你快速上手,提升搜尋效率。
ChatGPT Search 是一項由 OpenAI 開發的新功能,能使 ChatGPT 從網路即時獲取最新資訊,提升回答的準確性與即時性。此功能方便用戶查詢最新新聞、天氣和股票價格,並提高寫作及創作效率。運用簡單的搜尋方式,使用者即可得到可靠的資料,精準引用並增強內容的可信度。
Felo Search 是 2024 年推出的智慧搜尋工具,支援多語言和跨語言搜尋,適合日常查詢和學術研究。Felo Search 提供免費和付費版,免費版適合日常使用,付費版能提供更深入的答案,Felo AI 無廣告且能生成思維導圖,讓搜尋過程更專注高效,是非英語使用者接觸全球知識的理想工具。
ChatGPT Canvas 是基於 GPT-4o 模型的全新動態界面,旨在提升寫作與程式開發的效率。它不僅提供智能編輯和寫作輔助功能,還支持程式碼轉換和錯誤修復,讓用戶能在更靈活的環境中創作。這篇文章介紹了 Canvas 的核心功能和使用流程,幫助使用者更好地瞭解如何利用此工具提升創作質量與效率。
Anthropic AI推出的Claude 3.5 Sonnet NLP模型提供卓越性能和強大的功能。透過本文,您將瞭解到Claude 3.5 Sonnet的特點、費用、操作說明,並透過實作範例深入瞭解其在程式設計方面的能力。
你可能也想看
Google News 追蹤
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
7月31日,OpenAI在其官方媒体账号上表示,开始向一小部分ChatGPT Plus用户推出高级语音模式。 当前,实时响应和可打断对话是公认的语音助手技术难点。而据OpenAI介绍,其推出的高级语音模式可以提供更自然的实时对话,允许用户随时打断,并能感知和响应用户的情绪。 此前,ChatGPT
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 如果您對自動模擬中的細節不滿意,您可以使用一系列引導 Prompt 將對話引導至您喜歡的方式,以下範例示
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
AI生成真的很厲害,看多了AI文,真的會對自己沒信心!🫠🙃😭
Thumbnail
據美聯社報導,OpenGPT.com 宣佈推出 OpenGPTs。用戶只需要發佈一個OpenGPTs,便能夠整合所有主要的 AI 引擎包括ChatGPT-4o, Google Imagen, Gemini Pro, 以及Claude 3.5等。
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 以下來談談生成式AI對未來世界的轉變: 商業格局重新構想:邁向未來,生成式人工智慧成為改變商業格局
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 生成式AI (Generative AI)是一種人工智慧,它調度機器學習方式來產生新的或者是原創的文字、
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
ChatGPT最近更新了語音對話功能,同時推出了附屬功能Read out loud,讓對話更方便。使用者可以立刻知道英文單字的讀音和例句唸法,加上十秒重播功能,非常實用。
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
7月31日,OpenAI在其官方媒体账号上表示,开始向一小部分ChatGPT Plus用户推出高级语音模式。 当前,实时响应和可打断对话是公认的语音助手技术难点。而据OpenAI介绍,其推出的高级语音模式可以提供更自然的实时对话,允许用户随时打断,并能感知和响应用户的情绪。 此前,ChatGPT
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 如果您對自動模擬中的細節不滿意,您可以使用一系列引導 Prompt 將對話引導至您喜歡的方式,以下範例示
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
AI生成真的很厲害,看多了AI文,真的會對自己沒信心!🫠🙃😭
Thumbnail
據美聯社報導,OpenGPT.com 宣佈推出 OpenGPTs。用戶只需要發佈一個OpenGPTs,便能夠整合所有主要的 AI 引擎包括ChatGPT-4o, Google Imagen, Gemini Pro, 以及Claude 3.5等。
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 以下來談談生成式AI對未來世界的轉變: 商業格局重新構想:邁向未來,生成式人工智慧成為改變商業格局
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 生成式AI (Generative AI)是一種人工智慧,它調度機器學習方式來產生新的或者是原創的文字、
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
ChatGPT最近更新了語音對話功能,同時推出了附屬功能Read out loud,讓對話更方便。使用者可以立刻知道英文單字的讀音和例句唸法,加上十秒重播功能,非常實用。