使用 Whisper AI 將錄音檔轉文字，女友求救成功經驗與產品構想

Tom

發佈於軟體開發與職場

2025/07/04 更新2025/06/29 發佈閱讀 4 分鐘

早上九點多，剛到公司開在路上開完早會，手機螢幕突然亮起，是女友傳來的訊息：「救命啊！我們老闆要我做昨天下班前會議的逐字稿，但我今天工作排超滿，根本沒空處理，你有什麼辦法可以救救我嗎？」

然後就把錄音檔傳過來。

老實說其實我也不太知道怎麼把錄音檔轉成文字檔。之前因為做podcast，剪輯簡介之類的要自己做實在太累了，我就有想做把我podcast的錄音檔去產出逐字檔，但我發現網路上轉換語音檔功能大部分都要錢。

也有很多幫你把 podcast檔案轉成逐字稿，做簡介，甚至分對話角色的服務，當然要價都不低。畢竟現在和AI扯上邊什麼都要錢。

最近在玩 Zebear 伺服器，裡面有很多寫好的模版放開源的工具，例如筆記軟體可以用開源的AFFiNE自己架，甚至訂閱費用越來越貴的Figma也有可以替代的開源軟體。

Wisper 語音檔轉成文字

不過為了要完成可愛女友的要求，我只好問一下chatgpt 有沒有什麼開源工具可以完成這個需求。gpt和我說了很多工具，他最推薦 Wisper 說是有中文支援。我看了一下。欸，使用方式滿簡單，只需要用 python和安裝套件就可以了。就想說來試試看。

Whisper 安裝方式：

pip install whisper ffmpeg

Whisper 使用指令：

whisper your-audio.mp3 --language Chinese --task transcribe

your-audio.mp3 是你的錄音檔。

然後你會看到他開始在轉換錄音檔，真的會把錄音內容識別出來。

雖然中文錯字還是很多，但至少是堪用的程度。

我是使用 m1 的 mac 去跑，m1 沒有 gpu好像會稍微慢一些，但也還算是可以轉。四十分鐘的錄音檔案大概轉了半個小時多一些，雖然有點久，但有成功完成任務就可以。

系統用量

記憶體和cpu用量算滿大的。

下一步，自動化

其實也不是真的自動化，因為還是需要上傳檔案然後產出逐字稿。應該說把這個服務做成產品，也就是作一個UI介面。

UI 流程圖

登入頁面 使用者首先進入登入畫面，通過帳號密碼驗證後，才能進入主系統頁面，也是為了紀錄使用者轉換的紀錄。
檔案上傳頁面 登入成功後，使用者會來到上傳頁面，可以：
- 選擇新的錄音檔進行上傳查看「檔案列表區塊（F）」中過去上傳過的檔案與其處理狀態
檔案列表區塊（F） 此區塊顯示：
- 上傳過的所有錄音檔清單每個檔案的處理狀態（如「轉換中」、「完成可下載」、「失敗」）可提供跳轉或下載按鈕
轉換中頁面（C） 當使用者上傳新的錄音檔後，會進入此頁面，顯示逐字稿處理進度（也可以改為在列表中即時顯示「轉換中」，非強制跳頁）
逐字稿結果頁面（D） 轉換完成後，使用者可以：
- 閱讀逐字稿進行下載或返回重新上傳其他檔案
下載成功提示（E） 成功下載後，系統提示使用者已完成操作，並可返回上傳頁面。

大概的頁面流程設計如上。雖然我比較擔心的是伺服器轉換要多久。

留言

湯編驛-湯姆實驗室

31會員

82內容數

這邊會放一些我自己的分享內容，實驗測試還有做的ＭＶＰ介紹

湯編驛-湯姆實驗室的其他內容

2025/04/11

如何判斷一個工程師程式碼是否寫得好？「主責檔案」的奇特方法。

本文分享之前遇到的奇耙分配程式碼方式－以檔案為單位分配程式碼（ACC制度），並提出更好的團隊管理方法。ACC制度忽略軟體開發的協作本質，易造成團隊士氣低落及不公平。文章建議以功能模組或業務邏輯分工，關注解決問題的過程而非單純究責，並善用工具輔助團隊討論而非單純作為評量依據，建立公開透明的評分機制。

2025/04/11

如何判斷一個工程師程式碼是否寫得好？「主責檔案」的奇特方法。

2025/04/02

別再讓老闆吃掉你的午休！勞基法35條教你如何巧妙拒絕會議，捍衛你的休息時間

本文探討臺灣勞基法中關於午休時間的規定，以及如何在職場中有效保護自己的午休時間不被侵佔。文章以一個員工在午休時間被迫參加冗長會議的案例開頭，引出午休時間是受法律保障的休息時間，僱主不得強迫員工在午休時間工作。文章並提供多種應對策略，包括非對抗式提醒技巧、與主管溝通的技巧、以及最後不得已的申訴管道。

2025/04/02

別再讓老闆吃掉你的午休！勞基法35條教你如何巧妙拒絕會議，捍衛你的休息時間

#AI 的其他內容

AI 特助開聘：Notion 工作空間，終於有自動做事的 AI 員工了｜Notion Custom Agents

金融人類學徒

AI 浪潮下的「毀滅性創新」：解析湯森路透、納斯達克股價重挫的關鍵

與老查一起讀商業好書

當部屬用 AI 一小時完成你三天的工作量，主管如何重塑領導力？運用「情境領導」重新定義 AI 協作時代的管理

你可能也想看

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品，以十段寓言式殘篇，重新拼貼記憶、暴力與美學，並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇：帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略，嘗試解析極權底下不可言說之事，將如何成為可被觀看的公共發聲。

#釀電影#釀評論#藝術評論

2026/01/14

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

#釀電影#釀評論#藝術評論

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

柏林劇團在 2026 北藝嚴選，再次帶來由布萊希特改編的經典劇目《三便士歌劇》（The Threepenny Opera），導演巴里・柯斯基以舞台結構與舞台調度，重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核，藉由沉浸與疏離的辯證，解析此作如何再次照見觀眾自身的位置。

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲．蓋柏樂》的詮釋，從劇本歷史、聲響與舞臺設計，到演員的主體創作方法，探討此版本如何讓經典劇作在當代劇場語境下煥發新生，滿足現代觀眾的觀看慾望。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

涵柳的沙龍

《轉轉生 Re:INCARNATION》：從身體與服裝看見奈及利亞的重生

《轉轉生》為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，融合舞蹈、音樂、時尚和視覺藝術，透過身體、服裝與群舞結構，回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發，分析《轉轉生》如何以當代目光，形塑去殖民視角的奈及利亞歷史。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

涵柳的沙龍

《轉轉生 Re:INCARNATION》：從身體與服裝看見奈及利亞的重生

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

令水鳥

跟同事們開業授課？

在公司我們都常常說著一些嗯～無聊的話，像是之前寫的「一大早就開車沒問題嗎？」又或者會說很多芭樂劇、八點檔、狗血劇那種話，嗯通常都是我先開頭的，像是這次：我走進小間儀器室裡。我：「我剛剛走出去將近5分鐘才回來，你們一定想我了對嗎？」我用著可憐兮兮的聲音說著

2024/07/22

2024/07/22

其實我對於蝦聊沒什麼意見，幹話是日常所需，也很療育，但次數多了、時間長了，還是發現自己消耗了，怪了，若真是回神工具，我怎麼還是這麼累？早上回覆個案問題時，我發現自己對於一行一行離散的資訊、橫切豎轉、斷崖式的紀錄有點不耐了，當然，不耐是我自身有心理需求，因為，我目前手邊有事要忙，但對方不

2024/06/19

2024/06/19

此時此刻，客服部門的電話響不停，掛了一通又有一通電話響起。遇到下雨天，就是我們最忙的時候。我剛剛怎麼會恍神了呢？應該是從電台裡傳出那熟悉的歌聲...。 3年多了，久違未見到的朋友。

2024/05/10

2024/05/10

上週錄的廣播訪談，今天播出了。早上忙亂一陣後，累攤在書桌前，於是決定打開線上連結，聽聽自己究竟講了什麼。感冒未癒，嗓音低了一階，但主持人是認識多年的朋友，好像隨意起個頭，就能不停往下聊。聊天當中，不免又要說起我這前後兩截全然不同的人生，讚賞我一頭栽進出版圈的勇氣。這段話，在今天聽來格外

2024/04/22

2024/04/22

四個多月之前，和朋友做了一檔內容，名稱是「我想和你說說話」。因為自己是說話的主角，希望可以和人分享一些想法或思考，所以取名為「我想和你說」。還記得，在和朋友的討論中，談及製作這檔內容的起心動念時，我曾說到——因為自己過去曾經歷了一段低潮的時刻，當時，我找了許多在不同人生階段認識的朋友聊天，而在互

2024/03/15

2024/03/15

快到家之前，要先生放我在便利商店下車。「幹嘛？」我想買罐啤酒。依舊是忙亂不堪的一天。早上的咖啡還沒喝完，就講了一個鐘頭的電話，和設計師討論棘手的案子。講完電話已耗盡元氣，但還得打起精神，處理雜務，然後出門陪爸爸回診。看完診，接著趕往北投，陪老師洽談一件合作案。告辭時，天已黑。

2024/03/13

2024/03/13

昨晚我的助手很慌張地打電話給我，感覺快哭了：「我把你的網站弄不見了，現在弄不回去，怎麼辦，網站會不會回不來了？」聽她緊張到話都快講不出來 ...

2024/02/01

2024/02/01

今天上班被一個阿姨客人說我很有耐心，她說我100分！這是快下班前發生的事，我感到有點開心，有點安慰，因為今天工作也讓人覺得很煩，主管一直在改我東西，一下又說我聽不懂他的意思，還有一些奇怪的客人，真的每分每秒都想趕快下班，所以一開始接到這位阿姨的時候，她一直聽不懂我的說明讓我很疑惑，也很煩躁，但我還是

2024/01/23

2024/01/23

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News