[Python] 語音技術與應用：語音轉文字

更新於 2023/04/29發佈於 2023/04/29閱讀時間約 2 分鐘

在這篇文章中，我們將講解一些常見的語音技術以及如何在Python中使用這些技術。

安裝套件

pip install pyaudio
pip install SpeechRecognition

匯入套件

import speech_recognition as sr
import pyttsx3
import os

語音辨識：

# 設置語音引擎
engine = pyttsx3.init()

# 設置語音識別器
r = sr.Recognizer()

# 設置麥克風作為音訊來源
with sr.Microphone() as source:
    print("說些什麼吧！")
    audio = r.listen(source)

# 將語音轉換為文字
try:
    text = r.recognize_google(audio, language='zh-TW')
    print("您說的是：" + text)
except sr.UnknownValueError:
    print("語音無法識別！")
    text = "語音無法識別"
except sr.RequestError as e:
    print("無法連接到語音識別服務： {0}".format(e))
    text = "無法連接到語音識別服務"

留言

留言分享你的想法！

程式輕鬆玩

71會員

150內容數

這裡將以輕鬆風格，深入探討程式設計的基礎和高級概念。從程式語言到演算法，我們將以易懂的方式解釋每個主題，讓你輕鬆掌握。無論你是初學者或有經驗者，都能在這裡找到適合你的內容。無論你的目標是成為專業開發者還是擴展知識，我們都會陪伴你一同成長！

程式輕鬆玩的其他內容

2025/04/20

AI新紀元與晶片風雲：本週五大科技風暴

本週科技圈掀起多項重磅消息：OpenAI於4月14日釋出GPT‑4.1系列模型，進一步強化編碼與長文理解能力 Reuters；Chipolo推出POP藍牙追蹤器，同時支援Apple與Google尋找網路 The Verge；南韓新創RLWRLD完成1,480萬美元募資，將打造專屬機器人基礎模型

2025/04/20

AI新紀元與晶片風雲：本週五大科技風暴

本週科技圈掀起多項重磅消息：OpenAI於4月14日釋出GPT‑4.1系列模型，進一步強化編碼與長文理解能力 Reuters；Chipolo推出POP藍牙追蹤器，同時支援Apple與Google尋找網路 The Verge；南韓新創RLWRLD完成1,480萬美元募資，將打造專屬機器人基礎模型

2025/04/20

本週遊戲搶先看：經典25年回歸、星戰版 XCOM、荒誕粉紅大戰、Game Pass 下架清單與 Steam 獨立新星

本週遊戲動態涵蓋經典 25 週年重返 PC 平台、回合制策略新作重燃星戰熱潮、Remedy 荒誕合擊新作搶先曝光、Game Pass 下架名單震撼登場，以及 Steam 獨立新秀推薦不容錯過 PC GamerWindows Central。

2025/04/20

本週遊戲搶先看：經典25年回歸、星戰版 XCOM、荒誕粉紅大戰、Game Pass 下架清單與 Steam 獨立新星

本週遊戲動態涵蓋經典 25 週年重返 PC 平台、回合制策略新作重燃星戰熱潮、Remedy 荒誕合擊新作搶先曝光、Game Pass 下架名單震撼登場，以及 Steam 獨立新秀推薦不容錯過 PC GamerWindows Central。

2025/04/08

恐慌中求生存！川普32%關稅風暴下台股大挫，投資人如何逆勢翻盤？

近來因為川普政府啟動全新一輪對等關稅政策，全球貿易風暴席捲而來，而台灣面臨的衝擊更是不容小覷。美方以台灣過去對美出口關稅達64%為依據，採取「對等關稅」原則回敬徵收32%關稅，這一舉措不僅使得國際市場恐慌連連，台股也出現劇烈下跌，吸引了各界關注。

2025/04/08

恐慌中求生存！川普32%關稅風暴下台股大挫，投資人如何逆勢翻盤？

近來因為川普政府啟動全新一輪對等關稅政策，全球貿易風暴席捲而來，而台灣面臨的衝擊更是不容小覷。美方以台灣過去對美出口關稅達64%為依據，採取「對等關稅」原則回敬徵收32%關稅，這一舉措不僅使得國際市場恐慌連連，台股也出現劇烈下跌，吸引了各界關注。

你可能也想看

方格子 vocus 官方沙龍

開箱你的美好生活：一起來寫開箱賺獎金！#品牌合作

「欸！這是在哪裡買的？求連結 🥺」誰叫你太有品味，一發就讓大家跟著剁手手？讓你回購再回購的生活好物，是時候該介紹出場了吧！「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩

#蝦皮分潤計畫#開箱#蝦皮

2025/05/12

方格子 vocus 官方沙龍

開箱你的美好生活：一起來寫開箱賺獎金！#品牌合作

「欸！這是在哪裡買的？求連結 🥺」誰叫你太有品味，一發就讓大家跟著剁手手？讓你回購再回購的生活好物，是時候該介紹出場了吧！「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩

#蝦皮分潤計畫#開箱#蝦皮

2025/05/12

阿Han的沙龍

【🆓 語音辨識引擎sherpa-onnx CPU上篇】讓您輕鬆體驗語音辨識功能(Docker架設)

還記得我們之前介紹過「【Google Colab Python系列】初探Whisper: 來一段Youtube影片進行語音辨識吧！」這套語音辨識引擎，那為什麼我們又要教這一套? 因為我們也可以將whisper的模型轉換成onnx的格式，輕鬆移植到各種平台，且效能更佳。語音辨識的熱門組件之

#sherpa#語音辨識#asr

2024/07/02

阿Han的沙龍

【🆓 語音辨識引擎sherpa-onnx CPU上篇】讓您輕鬆體驗語音辨識功能(Docker架設)

還記得我們之前介紹過「【Google Colab Python系列】初探Whisper: 來一段Youtube影片進行語音辨識吧！」這套語音辨識引擎，那為什麼我們又要教這一套? 因為我們也可以將whisper的模型轉換成onnx的格式，輕鬆移植到各種平台，且效能更佳。語音辨識的熱門組件之

#sherpa#語音辨識#asr

2024/07/02

螃蟹_crab的沙龍

[Python]使用SpeechRecognition進行語音辨識

本文主要使用SpeechRecognition來做一個簡單的語音辨識，使用pyqt5介面呈現。按下Start Recording，開始錄音，並顯示請開始說話。然後按鈕名改名Stop 在按下Stop Recording，稍等片刻後就會呈現出辨識結果程式範例 import sys i

#Python#語音辨識#SpeechRecognition

2024/06/22

螃蟹_crab的沙龍

[Python]使用SpeechRecognition進行語音辨識

本文主要使用SpeechRecognition來做一個簡單的語音辨識，使用pyqt5介面呈現。按下Start Recording，開始錄音，並顯示請開始說話。然後按鈕名改名Stop 在按下Stop Recording，稍等片刻後就會呈現出辨識結果程式範例 import sys i

#Python#語音辨識#SpeechRecognition

2024/06/22

Wei 的工程師聊什麼

使用 OpenAI Whisper API 進行語音轉文字，方便字幕後製或內容整理

本文介紹如何設置OpenAI API密鑰並使用Whisper API轉寫音訊檔案。文章詳細說明了轉寫單個音訊檔案，以及將長音訊分割並轉寫的過程。透過範例演示，讀者可以學習如何將音訊轉寫為文字，提高工作效率。

#OpenAI#檔案#程式

2024/02/13

Wei 的工程師聊什麼

使用 OpenAI Whisper API 進行語音轉文字，方便字幕後製或內容整理

本文介紹如何設置OpenAI API密鑰並使用Whisper API轉寫音訊檔案。文章詳細說明了轉寫單個音訊檔案，以及將長音訊分割並轉寫的過程。透過範例演示，讀者可以學習如何將音訊轉寫為文字，提高工作效率。

#OpenAI#檔案#程式

2024/02/13

無限智慧學院的沙龍

一起探索文生語音的奧術，OpenVoice 開源MyShell.ai後臺模型

要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成，這聽起來很不可思議對吧? 但這就是本篇論文取得的成就，不僅如此，該有的功能，如調整情感，口音節奏，停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文，這會是很有趣的旅程。

#AI論文詳解#OpenVoice#MyshellAI

2024/01/19

無限智慧學院的沙龍

一起探索文生語音的奧術，OpenVoice 開源MyShell.ai後臺模型

要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成，這聽起來很不可思議對吧? 但這就是本篇論文取得的成就，不僅如此，該有的功能，如調整情感，口音節奏，停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文，這會是很有趣的旅程。

#AI論文詳解#OpenVoice#MyshellAI

2024/01/19

無限智慧學院的沙龍

三分鐘內實作聲音轉字幕網頁App

相信替影片配字幕是許多人心中的痛，本文帶你在三分鐘內能夠用你的電腦，實做聲音轉字幕網站，準備好了就來吧!

#Huggingface#github#三分鐘

2023/11/04

無限智慧學院的沙龍

三分鐘內實作聲音轉字幕網頁App

相信替影片配字幕是許多人心中的痛，本文帶你在三分鐘內能夠用你的電腦，實做聲音轉字幕網站，準備好了就來吧!

#Huggingface#github#三分鐘

2023/11/04

多語自學者

【AI＋語言學習】跟 ChatGPT 練習對話｜實用免費外掛工具＆擴增功能 Voice Control for Chat

調校電腦系統軟硬體，開啟 ChatGPT 的語音外掛，擴增 ChatGPT 的語音功能，升級進化 AI !!!

#語言學習#AI#ChatGPT

2023/06/08

多語自學者

【AI＋語言學習】跟 ChatGPT 練習對話｜實用免費外掛工具＆擴增功能 Voice Control for Chat

調校電腦系統軟硬體，開啟 ChatGPT 的語音外掛，擴增 ChatGPT 的語音功能，升級進化 AI !!!

#語言學習#AI#ChatGPT

2023/06/08

阿Han的沙龍

【Google Colab Python系列】OpenAI Whisper: 語音辨識產生字幕檔

上一篇「【Google Colab Python系列】初探Whisper: 來對一段Youtube影片進行辨識吧！」我們介紹了Whisper的基本用法及功能，這次我們除了語音辨識之外，還要下載辨識後的字幕檔，我想這對於我們常常看到沒有字幕的影片，若想要進行辨識與翻譯時非常有幫助。這次的篇章主要做

#OpenAI#whisper#語音辨識

2023/04/24

阿Han的沙龍

【Google Colab Python系列】OpenAI Whisper: 語音辨識產生字幕檔

上一篇「【Google Colab Python系列】初探Whisper: 來對一段Youtube影片進行辨識吧！」我們介紹了Whisper的基本用法及功能，這次我們除了語音辨識之外，還要下載辨識後的字幕檔，我想這對於我們常常看到沒有字幕的影片，若想要進行辨識與翻譯時非常有幫助。這次的篇章主要做

#OpenAI#whisper#語音辨識

2023/04/24

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News