方格子 vocus

在 Mac 上安裝並使用 mlx-whisper 語音轉文字完整教學

Josh

發佈於AI

2026/03/27 更新2026/03/25 發佈閱讀 7 分鐘

前置條件

在開始之前，請確認你的環境符合以下條件：

Mac 搭載 M 系列晶片（Apple Silicon）
macOS 14.0 以上
Python 3.10 以上（原生 arm64 版本，非 Rosetta）
已安裝 Homebrew

可以用以下指令確認 Python 是否為原生 arm 版本：

python -c "import platform; print(platform.processor())"

結果應該是 arm，若顯示 i386 代表你正在使用 Rosetta 模式，需要改用原生 Python。

建立虛擬環境並安裝套件

建議使用虛擬環境避免套件版本衝突。

python3 -m venv .venv
source .venv/bin/activate
pip install -U pip
pip install mlx-whisper

這幾行指令的說明：

python3 -m venv .venv：在目前資料夾建立一個名為 .venv 的虛擬環境
source .venv/bin/activate：進入虛擬環境，終端機前會出現 (.venv) 提示
pip install -U pip：把 pip 升級到最新版，避免安裝新套件時出現相容性問題
pip install mlx-whisper：安裝主套件

要退出虛擬環境時，輸入 deactivate 即可。

安裝 ffmpeg

mlx-whisper 需要 ffmpeg 處理音訊格式，用 Homebrew 安裝：

brew install ffmpeg

準備測試音訊

Mac 內建 say 指令可以直接產生語音測試檔，不需要另外下載：

# 英文測試
say -o test_audio.aiff "Hello, this is a test audio file."
ffmpeg -i test_audio.aiff audio_file.mp3

# 繁體中文測試（使用內建美佳語音）
say -v Meijia -o test_audio.aiff "你好，這是一個測試音訊檔案。"
ffmpeg -i test_audio.aiff audio_file.mp3

登入 Hugging Face

下載模型前需要先登入 Hugging Face，否則會出現 401 或 404 錯誤。

前往 https://huggingface.co/settings/tokens 建立一個 Read 權限的 token，再執行：

python -c "from huggingface_hub import login; login(token='hf_你的token')"

登入成功後 token 會儲存在 ~/.cache/huggingface/token，之後不需要重複登入。

執行語音轉錄

mlx_whisper audio_file.mp3 --model mlx-community/whisper-large-v3-mlx

第一次執行時會自動從 Hugging Face 下載模型，whisper-large-v3-mlx 約 3GB，下載完成後會快取在：

之後再次執行相同模型就不會重複下載。

轉錄完成後，結果會輸出到同名的 .txt 檔案，例如 audio_file.txt。

如果想釋放硬碟空間，可以用以下指令刪除已下載的模型：

rm -rf ~/.cache/huggingface/hub/models--mlx-community--whisper-large-v3-mlx/

刪除後若再次執行轉錄，會重新從 Hugging Face 下載。若想確認目前快取了哪些模型以及各自佔用的空間，可以執行：

du -sh ~/.cache/huggingface/hub/*/

常見模型選擇

mlx-community 提供多種大小的 Whisper 模型，正確的 repo 名稱格式需要加上 -mlx 後綴：

tiny：mlx-community/whisper-tiny-mlx，速度最快，精度較低
small：mlx-community/whisper-small-mlx，輕量平衡
large-v3：mlx-community/whisper-large-v3-mlx，高精度
large-v3-turbo：mlx-community/whisper-large-v3-turbo，速度與精度的最佳平衡，推薦
distil-large-v3：mlx-community/distil-whisper-large-v3，蒸餾版，速度快

如果主要轉錄中文，建議使用 large-v3 以上的模型，tiny 對中文的識別準確率偏低。

輸出繁體中文

參考資料-簡繁轉換不再亂碼！開源神組件 OpenCC 安裝與模式切換全攻略

Whisper 轉錄中文時預設輸出簡體，可以用 opencc 做後處理轉換成繁體台灣用語：

pip install opencc-python-reimplemented

轉換指令：

python -c "import opencc; c = opencc.OpenCC('s2twp'); print(c.convert(open('audio_file.txt').read()))" > audio_file_tw.txt

s2twp 模式會將簡體轉為繁體，並同時替換為台灣慣用詞，例如「軟件」→「軟體」、「音讯」→「音訊」。

一行完成轉錄到繁體輸出

把上面兩個步驟串在一起，每次只需要一行指令：

mlx_whisper 你的音訊.mp3 --model mlx-community/whisper-large-v3-mlx && \
python -c "import opencc; c = opencc.OpenCC('s2twp'); print(c.convert(open('你的音訊.txt').read()))" > 你的音訊_tw.txt

把 你的音訊 替換成實際的檔名即可。執行後會產生兩個檔案：簡體原始版本與繁體台灣版本，整個流程完全在本機離線運行，不需要送出任何資料到外部服務。

相關參考

https://blog.darkthread.net/blog/openai-whisper/

留言

Josh的沙龍

15會員

119內容數

分享知識

Josh的沙龍的其他內容

2026/03/09

這是一款 Chrome 輕量筆記工具，支援多種視圖與 Markdown 編輯，並透過分塊技術解決雲端儲存限制。本文深入解析其核心功能與技術架構，推薦給追求高效資訊整理與擴充套件開發的讀者參考。

2026/03/09

2026/02/27

掌握 OpenAI Codex 斜線指令 (Slash Commands)：提升開發效率的完整指南

OpenAI Codex 推出高效率「/」斜線指令，本文完整解析系統管理、模型控制、進階工作流與自訂指令等四大核心功能，助開發者精準掌握 AI 代理工作流，大幅提升專案開發、測試與重構的實質效率。

2026/02/27

掌握 OpenAI Codex 斜線指令 (Slash Commands)：提升開發效率的完整指南

2026/02/25

實戰教學：在 AI 終端機完美結合 OpenSpec 與 Superpowers 開發工作流

想在終端機發揮 AI 輔助開發的最大威力？本文以實作網站深色模式為例，帶你一步步輸入指令，完美結合 OpenSpec 與 Superpowers，從需求對焦到 TDD 實作，打造嚴謹的高效工作流。

2026/02/25

實戰教學：在 AI 終端機完美結合 OpenSpec 與 Superpowers 開發工作流

看更多

你可能也想看

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

背景：從冷門配角到市場主線，算力與電力被重新定價小P從2008進入股市，每一個時期的投資亮點都不同，記得2009蘋果手機剛上市，當時蘋果只要在媒體上提到哪一間供應鏈，隔天股價就有驚人的表現，當時光學鏡頭非常熱門，因為手機第一次搭上鏡頭可以拍照，也造就傳統相機廠的殞落，如今手機已經全面普及，題

#AI#算力#電力

2026/04/11

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

#AI#算力#電力

2026/04/11

凱文馬拉穆の雪橇犬星球

為什麼我選擇GoodTape而非MacWhisper？寫完500篇部落格後我的真實體驗

GoodTape 是一款音訊轉文字工具，它比 MacWhisper 更快、更方便、更安全，也更適合處理多語言和大量檔案。作者詳細說明瞭選擇 GoodTape 的五個原因，以及它如何提高工作效率，並提供 GoodTape 折扣碼和註冊連結。

#雲端#Podcast#折扣碼

2025/02/28

凱文馬拉穆の雪橇犬星球

為什麼我選擇GoodTape而非MacWhisper？寫完500篇部落格後我的真實體驗

#雲端#Podcast#折扣碼

2025/02/28

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11