更新於 2023/03/13閱讀時間約 2 分鐘

教我如何簡易創建將聲音轉文字的語音辨識方法(含實作及測試結果)

DALL-E2 pic
DALL-E2 pic
現在語音辨識越來越普及,這真是太好了!只要開口說話就可以完成很多操作。

舉例

開始說話-說話的內容轉儲為文字檔
承上一篇的學習研究,文字內容可再經由ChatGPT重點整理成會議紀錄的應用方向。

方法

這裡以Python中的SpeechRecognition套件為例,使用Jupyter Notebook運行。
Python中有很多語音辨識庫可供選擇,例如Google Speech Recognition,Microsoft Bing Voice Recognition,CMU Sphinx等等。不同的庫有不同的優缺點,我們可以根據自己的需求來選擇。

流程

  • 安裝SpeechRecognition套件
  • 複製貼上程式碼
  • 按下Shift+Enter來執行
  • 開始說話
  • 取得語音轉文字的文件
接下來,演示一下如何在電腦本地實現語音辨識:

第一步安裝SpeechRecognition套件

使用以下的指令安裝SpeechRecognition套件:
! pip install SpeechRecognition
可在Jupyter Notebook中執行這個命令或在終端機執行
Jupyter Notebook
ChatGPT教學

第二步複製貼上程式碼

(在程式碼與簡介中的連結補充)

第三步按下Shift+Enter來執行當前的程式碼區塊與執行結果顯示

Jupyter Notebook
我說了簡單的三個動物,並自動紀錄在.csv檔中
語音轉文字紀錄於.csv

運行Python程式碼的方式

若是初學者,可先前往Anaconda官方網站下載對應電腦作業系統的版本:
安裝好Anaconda之後,就可以使用它所包含的Jupyter Notebook來運行Python程式碼了。
使用Jupyter Notebook可以輕鬆地在瀏覽器中運行Python程式碼並查看結果。
如果需要更進一步的使用教學,建議可參考Anaconda官方文件或者相關的線上教學資源。

程式碼與簡介

活用Python套件與ChatGPT學習,就像是在開車時使用GPS導航一樣,可以幫助我們更快地到達目的地,而且還不容易迷路!
幫助我們更快地學習並應用相關技術,並將其應用到實際問題中,帶來更高效和精確的解決方案研究。
分享至
成為作者繼續創作的動力吧!
© 2025 vocus All rights reserved.