<ChatGPT學習筆記>ChatGPT教我如何簡易創建將聲音轉文字的語音辨識方法(含實作及測試結果)

更新於 發佈於 閱讀時間約 2 分鐘
DALL-E2 pic
現在語音辨識越來越普及,這真是太好了!只要開口說話就可以完成很多操作。

舉例

開始說話->說話的內容轉儲為文字檔
承上一篇的學習研究,文字內容可再經由ChatGPT重點整理成會議紀錄的應用方向。

方法

這裡以Python中的SpeechRecognition套件為例,使用Jupyter Notebook運行。
Python中有很多語音辨識庫可供選擇,例如Google Speech Recognition,Microsoft Bing Voice Recognition,CMU Sphinx等等。不同的庫有不同的優缺點,我們可以根據自己的需求來選擇。

流程

  • 安裝SpeechRecognition套件
  • 複製貼上程式碼
  • 按下Shift+Enter來執行
  • 開始說話
  • 取得語音轉文字的文件
接下來,演示一下如何在電腦本地實現語音辨識:

第一步安裝SpeechRecognition套件

使用以下的指令安裝SpeechRecognition套件:
! pip install SpeechRecognition
可在Jupyter Notebook中執行這個命令或在終端機執行
Jupyter Notebook
ChatGPT教學

第二步複製貼上程式碼

(在程式碼與簡介中的連結補充)

第三步按下Shift+Enter來執行當前的程式碼區塊與執行結果顯示

Jupyter Notebook
我說了簡單的三個動物,並自動紀錄在.csv檔中
語音轉文字紀錄於.csv

運行Python程式碼的方式

若是初學者,可先前往Anaconda官方網站下載對應電腦作業系統的版本:
安裝好Anaconda之後,就可以使用它所包含的Jupyter Notebook來運行Python程式碼了。
使用Jupyter Notebook可以輕鬆地在瀏覽器中運行Python程式碼並查看結果。
如果需要更進一步的使用教學,建議可參考Anaconda官方文件或者相關的線上教學資源。

程式碼與簡介

活用Python套件與ChatGPT學習,就像是在開車時使用GPS導航一樣,可以幫助我們更快地到達目的地,而且還不容易迷路!
幫助我們更快地學習並應用相關技術,並將其應用到實際問題中,帶來更高效和精確的解決方案研究。
為什麼會看到廣告
avatar-img
19會員
6內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
米阿吉的沙龍 的其他內容
辦公室應用:會議記錄自動重點生成 使用輔助工具: Microsoft Teams 線上會議功能 : 捕捉會議對話內容 ChatGPT : 生成會議記錄 注意:以上這兩段的產出內容,可能需要人工進一步的審核和修改。
ChatGPT教我的第一張AI繪圖! 提供大家操作方法與手把手的過程分享
利用擴充套件sharegpt,就能和朋友分享ChatGPT的完整聊天紀錄。 方式:開啟sharegpt網站,點擊Install extension即可 #ChatGPT
辦公室應用:會議記錄自動重點生成 使用輔助工具: Microsoft Teams 線上會議功能 : 捕捉會議對話內容 ChatGPT : 生成會議記錄 注意:以上這兩段的產出內容,可能需要人工進一步的審核和修改。
ChatGPT教我的第一張AI繪圖! 提供大家操作方法與手把手的過程分享
利用擴充套件sharegpt,就能和朋友分享ChatGPT的完整聊天紀錄。 方式:開啟sharegpt網站,點擊Install extension即可 #ChatGPT
你可能也想看
Google News 追蹤
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
還記得我們之前介紹過「【Google Colab Python系列】 初探Whisper: 來一段Youtube影片進行語音辨識吧!」這套語音辨識引擎, 那為什麼我們又要教這一套? 因為我們也可以將whisper的模型轉換成onnx的格式, 輕鬆移植到各種平台, 且效能更佳。 語音辨識的熱門組件之
Thumbnail
本文主要使用SpeechRecognition來做一個簡單的語音辨識,使用pyqt5介面呈現。 按下Start Recording,開始錄音,並顯示請開始說話。然後按鈕名改名Stop 在按下Stop Recording,稍等片刻後就會呈現出辨識結果​ 程式範例 import sys i
Thumbnail
ChatGPT(全名:聊天生成預訓練轉換器)是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出,使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型,並以強化學習進行訓練。
Thumbnail
ChatGPT 是 OpenAI 開發的大型語言模型,以其強大的生成能力和對話能力而聞名。 ChatGPT 的訓練過程主要分為兩個階段:預訓練和微調。 微調使用了 RLHF(Reinforcement Learning from Human Feedback)技術,可以有效地提高模型生成內容的質量。
Thumbnail
在這篇文章中,我們將探討如何利用ChatGPT這個強大的語言模型來學習其他語言,並比較其與Google翻譯的優缺點。無論你是想提升外語能力還是在跨文化交流中更加流暢,ChatGPT都是一個極具價值的工具。
Thumbnail
從ChatGPT 4.0到GPTs 我是ChatGPT 4.0的付費使用者,說真格的,自從付費之後,就不想退出了,因為真是好用。 最近,ChatGPT 4.0又提供了GPTs的服務...... 有時候別人邀請我演講,我都會先溝通需求,有一次,某間學校邀請我對學生分享ChatGPT等生成式人工智
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
本文提供如何使用 Google Colab 結合 Faster Whisper 來提升語音辨識速度與準確性,包含安裝指南與使用方法。探索如何將語音轉換為文本,並對檔案進行不同格式的輸出。
Thumbnail
ChatGPT最近更新了語音對話功能,同時推出了附屬功能Read out loud,讓對話更方便。使用者可以立刻知道英文單字的讀音和例句唸法,加上十秒重播功能,非常實用。
Thumbnail
本篇筆記了如何使用Google Colab和OpenAI的Whisper Large V3進行免費且開源的語音辨識。涵蓋從基礎設定到實際運用的步驟,適合初學者和技術愛好者輕鬆學習語音辨識技術。
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
還記得我們之前介紹過「【Google Colab Python系列】 初探Whisper: 來一段Youtube影片進行語音辨識吧!」這套語音辨識引擎, 那為什麼我們又要教這一套? 因為我們也可以將whisper的模型轉換成onnx的格式, 輕鬆移植到各種平台, 且效能更佳。 語音辨識的熱門組件之
Thumbnail
本文主要使用SpeechRecognition來做一個簡單的語音辨識,使用pyqt5介面呈現。 按下Start Recording,開始錄音,並顯示請開始說話。然後按鈕名改名Stop 在按下Stop Recording,稍等片刻後就會呈現出辨識結果​ 程式範例 import sys i
Thumbnail
ChatGPT(全名:聊天生成預訓練轉換器)是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出,使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型,並以強化學習進行訓練。
Thumbnail
ChatGPT 是 OpenAI 開發的大型語言模型,以其強大的生成能力和對話能力而聞名。 ChatGPT 的訓練過程主要分為兩個階段:預訓練和微調。 微調使用了 RLHF(Reinforcement Learning from Human Feedback)技術,可以有效地提高模型生成內容的質量。
Thumbnail
在這篇文章中,我們將探討如何利用ChatGPT這個強大的語言模型來學習其他語言,並比較其與Google翻譯的優缺點。無論你是想提升外語能力還是在跨文化交流中更加流暢,ChatGPT都是一個極具價值的工具。
Thumbnail
從ChatGPT 4.0到GPTs 我是ChatGPT 4.0的付費使用者,說真格的,自從付費之後,就不想退出了,因為真是好用。 最近,ChatGPT 4.0又提供了GPTs的服務...... 有時候別人邀請我演講,我都會先溝通需求,有一次,某間學校邀請我對學生分享ChatGPT等生成式人工智
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
本文提供如何使用 Google Colab 結合 Faster Whisper 來提升語音辨識速度與準確性,包含安裝指南與使用方法。探索如何將語音轉換為文本,並對檔案進行不同格式的輸出。
Thumbnail
ChatGPT最近更新了語音對話功能,同時推出了附屬功能Read out loud,讓對話更方便。使用者可以立刻知道英文單字的讀音和例句唸法,加上十秒重播功能,非常實用。
Thumbnail
本篇筆記了如何使用Google Colab和OpenAI的Whisper Large V3進行免費且開源的語音辨識。涵蓋從基礎設定到實際運用的步驟,適合初學者和技術愛好者輕鬆學習語音辨識技術。