(本篇文章是使用Typeless與Handy製作的)
最近使用了三個語音轉文字工具,分別是 Handy、Wispr Flow 與 Typeless。先大約講一下我目前的使用情境:
在以下情境中,我常常使用的語言有三種:中文、英文跟日文。這三種語言會交替使用,也就是說可能會有中文夾雜英文的情況:
1. 大部分都還是在電腦版的 Line 做對話
2. 懶得打字或撰寫文章的時候
此外,我在網路上也有看到有人「用嘴做 Voice Coding」(用語音寫程式),聽說效果也很不錯。
結論
為了讓大家不用看那麼冗長的心得,我先把結論放在這裡:
如果你預算充足,直接購買 Typeless 的 Pro 版即可。如果你想省錢,有另一個次好的方法:
1. 同時下載 Typeless 與 Handy
2. 輸出長句子時,使用 Typeless
3. 輸出短句(一句話)時,使用 Handy
我覺得這是最能夠節省成本,並保持免費額度的一個方法。
接下來會講解一下這三個工具我目前的使用心得,以及各自的優劣勢:
Handy
首先是 Handy,這是一個免費的開源的語音轉文字工具。
基本上下載之後,在它的程式裡面再下載一個語音轉文字的 model 下來,就可以直接使用。它目前能支援的模型有兩種:
1. Wisper
2. Parakeet(只支援英文)
我目前只使用的是whisper median這個模型,然後我認為它在語音轉中文的時候其實效果不錯。如果對於簡體中文有反感的使用者,其實它可以強制輸出成繁體中文。
優點是:
- 免費
缺點則有幾個:
- 它輸出的內容基本上就是你講的原話,不太會自動提供標點符號。這變成你每次輸出後,都還要重新看過一遍文字並手動加上標點。
- 它有時候會蹦出簡體中文,但這種情況蠻少的。
- 他的反應速度是三個工具裡面最慢的,也就是你在語音講完之後你必須要等個兩到三秒,甚至久一點五秒才會出現結果
- 如果是在句子中央夾雜英文、日文或中文等不同語言,它容易會偵測錯誤。
Wispr Flow
我之前就聽過 Wispr Flow,但最近才開始正式使用。相較於 Handy,它有幾個顯著的好處:
1. 自動修飾內容:它的輸出並非直接照錄說話內容,而是會經過修飾後再提供文字。
2. 優異的語言切換:在句子中夾雜中文、日文、英文時,它的偵測非常清晰。
3. 自動標點符號:它會自動提供標點,如果順利的話,講完就能直接輸出,最多只需修正一些專有名詞的錯字。
不過,它還是有一些缺點:
1. 簡體中文問題:即便要求輸出繁體,有時還是會跳出簡體中文。
2. 輸出非預期內容:這是我最困惑的地方,有時它會多出一些我沒說過的內容。甚至有一次我只說了「好的」,它卻直接輸出一整篇文章,讓我有點嚇到。
3. 轉換邏輯不穩:整體的轉換有時會顯得有點奇怪。
目前感受到的缺點大概就這幾個。
價格上來說,Wispr Flow 提供了免費版:在電腦上每週 2,000 字,而在 iPhone 上則是每週 1,000 字。
如果超過這個限額就需要付費,其計費方式如下:
1. 月繳:250 元台幣
2. 年繳:每月折合 200 元台幣
Typeless
最近看到有一些 KOL 在推薦 Typeless,我也在想 Typeless 的效果到底有多好,所以就把 Handy、Wispr Flow 和 Typeless 都下載下來試用了一遍。
相較於 Wispr Flow,Typeless 解決了非常多缺點:
1. 繁簡轉換問題:到目前為止,我遇到簡體中文輸出的狀況頻率低很多。
2. 輸出穩定度:我認為它的輸出非常穩定。
3. 轉換邏輯:在修飾內容的過程中,它的轉換邏輯是非常穩定的。
雖然它還是會蹦出一些小錯誤,但是這些錯誤我認為需要更改的頻率,相較於 Wispr Flow 來講低很多。所以這是我目前最推薦的一個語音轉文字
價格上來講,Typeless 免費版提供每週 4,000 字的輸出;超過 4,000 字的額度則需要付費。
付費方案分為兩種:
1. 月繳:每個月 $30 美金
2. 年繳:折合每個月 $12 美金
https://www.typeless.com/refer?code=JXYNX3U
上面的連結是我 Typeless 的 Reference Code,如果有人有興趣的話可以使用



















