[Python]使用SpeechRecognition進行語音辨識

2024/06/22 更新2024/06/22 發佈閱讀 10 分鐘

本文主要使用SpeechRecognition來做一個簡單的語音辨識，使用pyqt5介面呈現。

按下Start Recording，開始錄音，並顯示請開始說話。然後按鈕名改名Stop
在按下Stop Recording，稍等片刻後就會呈現出辨識結果

程式範例

import sys
import speech_recognition as sr
from PyQt5.QtWidgets import QApplication, QWidget, QPushButton, QTextEdit, QVBoxLayout
from PyQt5.QtCore import Qt
import threading

class AudioRecorder(QWidget):
    def __init__(self):
        super().__init__()

        self.initUI()
        self.recording = False
        self.recognizer = sr.Recognizer()
        self.audio = None
        self.thread = None

    def initUI(self):
        self.setGeometry(300, 300, 300, 200)
        self.setWindowTitle('Audio Recorder')

        layout = QVBoxLayout()

        self.start_button = QPushButton('Start Recording')
        self.start_button.clicked.connect(self.toggle_recording)
        layout.addWidget(self.start_button)

        self.text_area = QTextEdit()
        self.text_area.setReadOnly(True)
        layout.addWidget(self.text_area)

        self.setLayout(layout)

    def toggle_recording(self):
        if self.recording:
            self.stop_recording()
        else:
            self.start_recording()

    def start_recording(self):
        self.recording = True
        self.start_button.setText('Stop Recording')
        self.text_area.setText("請開始說話：")
        self.thread = threading.Thread(target=self.record_audio)
        self.thread.start()

    def stop_recording(self):
        self.recording = False
        self.start_button.setText('Start Recording')
        if self.thread:
            self.thread.join()
        self.recognize_audio()

    def record_audio(self):
        microphone = sr.Microphone()

        with microphone as source:
            self.recognizer.adjust_for_ambient_noise(source)
            self.audio = self.recognizer.listen(source)

    def recognize_audio(self):
        try:
            text = self.recognizer.recognize_google(self.audio, language='zh-tw')
            self.text_area.setText(text)
        except sr.UnknownValueError:
            self.text_area.setText("無法辨識音訊")
        except sr.RequestError as e:
            self.text_area.setText(f"無法連接到Google服務；{e}")

    def closeEvent(self, event):
        if self.recording:
            self.stop_recording()
        event.accept()

if __name__ == '__main__':
    app = QApplication(sys.argv)
    ex = AudioRecorder()
    ex.show()
    sys.exit(app.exec_())

程式碼重點說明

定義 `AudioRecorder` 類別

class AudioRecorder(QWidget):
    def __init__(self):
        super().__init__()

        self.initUI()
        self.recording = False
        self.recognizer = sr.Recognizer()
        self.audio = None
        self.thread = None

__init__ 方法：初始化類別。這裡設置了一些初始狀態，如錄音狀態、語音辨識器和音頻數據。

錄音和停止錄音的邏輯

    def toggle_recording(self):
        if self.recording:
            self.stop_recording()
        else:
            self.start_recording()

    def start_recording(self):
        self.recording = True
        self.start_button.setText('Stop Recording')
        self.text_area.setText("請開始說話：")
        self.thread = threading.Thread(target=self.record_audio)
        self.thread.start()

    def stop_recording(self):
        self.recording = False
        self.start_button.setText('Start Recording')
        if self.thread:
            self.thread.join()
        self.recognize_audio()

toggle_recording ：根據當前錄音狀態切換開始或停止錄音。
start_recording ：開始錄音，將按鈕文本設為 "Stop Recording"，並啟動新執行緒來錄製音頻。
stop_recording ：停止錄音，將按鈕文本設為 "Start Recording"，並在執行緒結束後進行語音辨識。

錄製音頻和語音辨識

    def record_audio(self):
        microphone = sr.Microphone()

        with microphone as source:
            self.recognizer.adjust_for_ambient_noise(source)
            self.audio = self.recognizer.listen(source)

    def recognize_audio(self):
        try:
            text = self.recognizer.recognize_google(self.audio, language='zh-tw')
            self.text_area.setText(text)
        except sr.UnknownValueError:
            self.text_area.setText("無法辨識音訊")
        except sr.RequestError as e:
            self.text_area.setText(f"無法連接到Google服務；{e}")

record_audio ：使用 speech_recognition 庫來錄製音頻。這裡使用了 Microphone 來捕捉音頻，並調整麥克風的背景噪音。
recognize_audio ：使用 Google 語音辨識服務將錄製的音頻轉換為文字，並顯示在文本區域。如果辨識失敗，則顯示錯誤信息。

視窗關閉事件

    def closeEvent(self, event):
        if self.recording:
            self.stop_recording()
        event.accept()

closeEvent 方法：在關閉窗口時，如果仍在錄音，則停止錄音，然後接受關閉事件。

#Python

#語音辨識

#SpeechRecognition

螃蟹_crab的沙龍AI深度學習筆記自然語言

留言

螃蟹_crab的沙龍

166會員

322內容數

本業是影像辨識軟體開發，閒暇時間進修AI相關內容，將學習到的內容寫成文章分享。興趣是攝影，踏青，探索未知領域。人生就是不斷的挑戰及自我認清，希望老了躺在床上不會後悔自己什麼都沒做。

螃蟹_crab的沙龍的其他內容

2024/06/29

[Python][自然語言]利用NLTK建立自己的情感分析模型

先前上一篇是使用NLT內置的電影評論數據集 movie_reviews，來訓練出情感分析模型，此篇文章介紹可以導入自己的訓練資料集來建立情感分析模組。 [Python][自然語言]NLTK 實現電影評論情感分析所需套件 pip install pandas pip install sci

2024/06/29

[Python][自然語言]利用NLTK建立自己的情感分析模型

2024/06/29

[Python][自然語言]NLTK 實現電影評論情感分析

情感分析是一種自然語言處理技術，用於自動識別和分析文本中的情感傾向，通常是正向、負向或中性。我們可以使用 NLTK 來實現一個基於單純貝斯分類器的情感分析模型。

2024/06/29

[Python][自然語言]NLTK 實現電影評論情感分析

2024/06/29

[Python][自然語言]文本處理工具nltk套件_初探索

本文介紹了流行的Python套件NLTK（Natural Language Toolkit）的主要特點、功能和在中文和英文語料上的應用。從安裝到實際應用，深入介紹了分詞、停用詞去除、詞性標註、命名實體識別等NLP任務的具體實現和步驟，幫助讀者理解和應用NLTK。

2024/06/29

[Python][自然語言]文本處理工具nltk套件_初探索

看更多

你可能也想看

黃郁書的沙龍

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》，由臺灣劇團「晃晃跨幅町」製作，本文將以從舞台符號、聲音與表演調度切入，討論海妲・蓋柏樂在父權社會結構下的困境，並結合榮格心理學與馮．法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析，理解女人何以走向精神性的操控、毀滅與死亡。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

黃郁書的沙龍

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11