我之前有在這邊講過語音轉文字的三個工具 Handy,其中我最推薦的是 Typeless 跟 Handy。但最近有新的想法了,所以想要跟大家講一下我對這些工具的新想法,以及我目前用的一個新工具。
首先是 Handy 的部分,因為它真的太笨了,所以我決定就最後不用它了。然後 Typeless 的部分主要有幾個原因:
1. 它最近可能是因為在開發新功能,所以有時候在使用它的語音轉換功能時,我講了一段話,它反而是用 AI 去回覆我這段話的內容。但我明明就只是想要語音轉文字這件事情而已,所以對我來講是蠻困擾的。
2. 當然有時候會爆出一堆簡體字。
3. 最後,我也會考慮之前討論過的 Typeless 隱私問題。
我最近有用的新工具是叫做 SayIt,它是由臺灣的工程師 Jackle 開發出來的,而且它是一個開源的專案(project)。大家也可以去 GitHub 看看,也可以先看我連結到他個人網站上的說明。
我稍微講一下我覺得它很棒的地方。它目前是我用過最貼近 Typeless 的免費開源工具。我覺得它很棒的地方就是:
1. 它會請你去申請一個 AI 平臺叫 Groq,使用 Groq 上面的 AI 平臺上的模型。
(a) 語音轉換模型:它是用 Whisper Large 或 Whisper Large Turbo。
(b) 文字整理模型:它可以給你用 Qwen3、Llama 跟 Kimi。
我目前的搭配是 Whisper Large 跟 Kimi。
2. AI 整理的 Prompt 也可以讓你調整,你可以選擇精簡版,或者是積極的部分。積極的部分就是像 Typeless 一樣,可以幫你列點、幫你重新改成段落。精簡版的部分就是單純幫你修一些錯字、去一些冗詞,然後補一些標點這樣而已。
它目前我覺得最好的功能就是「短文字門檻」。短文字門檻就是說,如果它從語音翻成文字之後,有文字上的限制,它如果低於某一段的字數,那它會直接貼上去,就不會再讓 AI 整理了。我個人覺得這個是非常好用的。
但是它還是有幾個小缺點:
1. 它目前預設的按鈕只能設定一個鍵。所以你只能選擇鍵盤上其中一個鍵,例如 Alt、Ctrl、Shift 或者是你自定義的鍵才用。但是 Typeless 那邊是可以用複合式的鍵,例如 Alt 加 Space 或 Ctrl 加 Alt 那種感覺。
2. 它不太能接受多語言的轉換。例如說我目前目標的語言是繁體中文,但如果我突然想要改成說日文的話,它會接受不了。它會直接用音譯的方式翻成中文,或者用翻譯的方式翻成中文。對我來講,這兩個都不是我要的,我要的就是日文,它也會有這個狀況。
3. 我剛剛才發現,它好像對於長文章的接受度有點問題,會很容易就辨識失敗。而且辨識失敗之後,你不能重來,你要重講一次。這個也算是硬傷,如果你講超過五分鐘的話就會有這個狀況。
就希望它能再多多改進,而且它是開源的,所以我也有看到有人 Fork 出去,然後去接它的 Local 模型,所以大家也多多支持。
官方網站在這邊: https://jackle.pro/tools/sayIt



























