最近經手了一些比較重要的案子,需要仔細聽會議中的細節內容,因此我習慣在會議中錄音,會後再進行整理。不知道大家有沒有遇過這種情況:普通的會議記錄可能只需要簡單的重點整理,但像這種關鍵性會議,往往需要逐字稿作為參考。
這時候,錄音轉文字的工具就非常實用,但問題也隨之而來。錄音轉文字工具對專有名詞、內部職位簡稱或行業術語的轉錄不夠精確,經常翻得亂七八糟。手動修正這些問題既費時又麻煩,簡直失去了使用工具簡化流程的意義。
市面上確實有不少專業的錄音轉文字工具,包括內建AI整理功能的軟體,但這類工具大多是訂閱制或需額外支付費用。對於像我這種偶爾才需要整理逐字稿的人,購買動機就比較低。所以我找到了一個免費且高效的替代方案,想分享給大家。
我目前採用了一個簡單的流程,大致能完成 70-80% 的逐字稿修正,雖然還不是百分百完美,但對偶爾一次重要會議紀錄已經非常足夠。以下是我的具體步驟:
1. 使用 Good Tape 進行錄音檔轉文字
經過搜尋,我發現 Good Tape 是一個不錯的選擇。它使用的是 Whisper AI 模型,能每月免費轉錄 3 次(每次限 90 分鐘),剛好符合我的需求:錄音時間長、且不想額外付費。
2. 用 GPT Prompt 處理逐字稿修正
錄音檔轉成文字後,接下來的重點是解決專有名詞亂翻的問題。我透過GPT ,讓它協助我逐步修正內容。以下是具體操作:
(1)說明需求與背景
清楚描述需求,Prompt如下:
我有一段會議錄音已經轉錄成文字,但因為包含許多[XX產業]和某家公司特有的專有名詞或職位名稱,轉錄過程中出現了許多不精準或難以理解的地方。以下是我希望你協助的工作方式:
1.檢查整段文字: 找出可能有語意不通、專有名詞錯誤或上下文不一致的地方。
2.集中問答: 將不合理的句子或段落整理出來,以簡單的問題形式呈現給我,幫助釐清每一部分的正確意思,而不是逐句修改整段內容。
3.輸出修正建議: 根據上下文與我的回答,提出修正後的建議文字。
4.保留專業性與精準度: 確保修正後的文字符合[XX產業]的用語與背景。
以下(或附件)是需要處理的會議逐字稿內容,請依照上述方式進行,並用簡短問答方式與我確認每個問題。請不要整合會議記錄的句子,也不要重組段落。最終依上述回饋的原則修改整份會議逐字稿給我(請不要精簡,維持time stamp的每一句,僅作文句修改):
會議記錄可以透過附件上傳或是直接分段複製貼上,但上傳附件文本我測試起來有一點翻譯不全(偷懶XD?),因此方便的話建議將逐字稿分段處理,ChatGPT 會逐句檢查並詢問
(2)與GPT問答,確認內文
GPT會詢問你類似下方的問題
問題整理
1.術語問題
*逐字稿中多次提到「OO」、「XX」等,這些是否是具體的部門名稱?如果是,能否確認正確寫法?
*「OOO」在逐字稿中反覆提及,應指什麼具體內容?
2.語意不清或語病
*「XXX佔了8% 那全部收益是4%」句子中「收益是4%」的上下文是否明確?是要比較什麼數字?
3.數字與邏輯矛盾
*例如「XXX滲透率是5%,一般客戶是2%」,是否可確認數據正確無誤?
4.專業性不足的部分
在描述「XXX」的效益時,有提到數據與提升計畫,但語句含混,是否需要整理清晰的執行步驟或量化目標?
你只要針對需要修正的部分回答它,例如1. 「北傑」= 台北捷運... 2.3.4.皆不用調整,並請他你完成階段性工作後可再進一步詢問確認。
(3)逐步處理會議記錄文本
後續GPT會呈現它調整後的文句與你與你確認是否OK,再確認後請他依照這個原則修改整份文件即可。
透過這個方法,我的逐字稿修正效率有了顯著提升。GPT 幾乎能準確處理 70%-80% 的問題,尤其是在專有名詞與簡稱的辨識上,效果還算不錯。節省部分時間,還讓我能更快整理出完整且有條理的會議內容。
其實如果有時間的話,有些人也會自己串whisper模型,好像也是挺好用的,只是很多還是需要事前準備,為了求快,就採用這種方式。主要還是因為不是很常需要這種功能,因此希望透過AI,用簡便、免費的方式解決這種低頻率的工作需求,如果你有更好的方法或是操作問題,可以一起交流。