《從語音到文章: 運用AI工具,激增寫作效率》3:口說成文的好處與語音辨識軟體選擇指南

更新於 發佈於 閱讀時間約 0 分鐘

這裡看上一集:

你習慣用語音來隨時紀錄自己的想法嗎?

自己口說成文有很多好處。首先,這種方式可以讓我們更加直觀地表達自己的想法,而不需要花太多時間思考如何用文字來表達。其次,通過口說,我們可以更加清晰地表達出自己的想法,進而更加了解自己的理解程度。而且,這種方式也可以幫助我們更好地記錄下自己的想法,方便我們以後進一步加工和修改。

使用自動化工具Zapier,可以讓這個「用語音捕捉靈感」的過程更加有效率。

我每天都會使用語音辨識軟體,將自己的口語轉換成文字,並且使用 ChatGPT 等 AI 工具來找出逐字稿中的重點,進一步幫助我整理出更具有邏輯性的內容。此外,我也使用 Notion 等數位平台上的 AI 工具,對文章進行進一步修改和潤色,讓文章更加具體詳細,更易讀。

不過關於使用哪一款語音辨識軟體或服務,其實也很有講究。

語音辨識自己的想法,基本上會遇到下面這三個主要問題。

首先是語音辨識的準確性。雖然現在語音辨識的科技已經很進步,但語音辨識出來的內容,仍然不是100%準確的。我自己主要使用的3種語音辨識服務,準確度從低到高的排序為Day One 日誌裡面的語音辨識,Open AI的Whisper到Fadel.io的VidCap。

第二是逐字稿資訊過多。口說往往比寫作更為冗長,這可能導致我們需要花費更多時間去篩選和編輯語音辨識後的逐字稿。我自己實務的經驗上,在口說時會看Day One 日誌顯示的已經辨識了多少個中文字。如果已經辨識到500個中文字,我就會停下來,當作是一次想法的捕捉。這樣控制口說內容的長度,對接下來的逐字稿編輯,文章潤色,都很有好處。

最後則是語音辨識的成本問題。高品質的語音辨識軟體和AI工具可能需要一定的費用。在2023年八月,Day One 日誌使用Premium服務一年是35美金,大約1100元新台幣。Open AI的Whisper的費率是每分鐘0.006美金。一則500個中文字的語音大約會是6分鐘,利用Open AI的Whisper辨識大約花費1.5元新台幣。而Fadel.io的VidCap則是一年33美金,大約990元新台幣。

選擇合適的語音辨識軟體,你需要先問自己這3個問題。

上面我介紹了我常用的語音辨識服務,分別是Day One 日誌裡面的語音辨識,Open AI的Whisper到Fadel.io的VidCap。 一個適合你的語音辨識軟體可能不適合其他人,所以最重要的是要根據自己的需求和預算進行選擇。

  1. 我會在哪些場景下使用語音辨識?:先想想看自己會在哪個場景下使用語音辨識。一些人可能需要在多種環境下使用語音辨識,例如在家裡、在外面、在車上等等。不同的使用場景,不同語音辨識軟體效果都會有差異。我自己是使用語音辨識的場景,主要就兩個:在外面走路前往某的地方的路上,在浴室浴缸泡澡的時候。(其實有一次我在UCLA被卡在電梯裡50分鐘,當時我就用語音辨識紀錄了很多內容,後來集結成小書,很方便)
  2. 這個語音辨識軟體或服務是否支援繁體中文?:不是所有語音辨識軟體都支持繁體語言。很多都是只有簡體中文,那麼辨識出來的效果,對於我們講台灣繁體中文的人就沒這麼好。我這裡介紹的Day One 日誌,Open AI的Whisper到Fadel.io的VidCap都能夠把繁體中文辨識得非常好。
  3. 語音辨識後的檔案是否能自由下載?:某些語音辨識軟體或服務是線上服務,你需要在他們的網站上上傳語音檔案或者線上錄音。要注意看錄音完或者上傳後的檔案是否可以下載回來,以及辨識出來的逐字稿是不是都能自由複製。如果不行,那等於被這些線上軟體綁架,要趕緊離開。我這裡介紹的Day One 日誌,Open AI的Whisper到Fadel.io的VidCap,都能夠很自由的取得語音辨識相關的檔案。

語音辨識不僅可以大大提高你的寫作速度和效率,還能讓你更加自然和真實地表達自己!通過選擇合適的語音辨識工具和方法,你可以克服逐字稿資訊過多、成本和準確性等方面的挑戰。只要用得順,這將為你帶來一個更高效、更滿意的寫作經歷。這就是「用語音捕捉靈感」能激增我們寫作效率的底層邏輯!

嘗試用語音辨識收集自己的想法吧!你會體會到一種前所未有的創作效率!

raw-image

覺得這篇文章有趣嗎?你可以

  • 追蹤我的方格子 ,看更多「原子寫作」與「卡片盒筆記法」相關的文章。
  • 追蹤我的Facebook,看更多美國相關的想法分享。
  • 追蹤「次原子想法」專題,看更多短但實用的簡單想法。
  • 追蹤「紫式書摘」,看看我的閱讀心得。
  • 追蹤「原紫短文」專題,看如何將簡單想法組合,實踐原子寫作原則。
  • 追蹤「Me, Myself & AI」專題,看看AI幫助我寫出的各種隨筆,或許有啟發。
  • 追蹤「數位筆記」專題,看更多數位筆記的實務法則
  • 追蹤「大綱即寫作」專題,看更多如何用OmniOutliner執行規模化寫作的技術
  • 追蹤「語音寫作」專題,看更多我最新對寫作與閱讀的疑問與思考
  • 訂閱「 紫式書齋」電子報,了解數位寫作,體驗世界文化啟發,掌握數據產業趨勢
avatar-img
536會員
1.8K內容數
Outline as Content
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
王啟樺的沙龍 的其他內容
透過Zapier建立出「思考自動化工具」真的很有意思。 透過將語音轉換為文字,每個人都可以更輕鬆自在地記錄自己的想法,進一步透過GPT4等AI,幫助我們找出自己談話逐字稿中的重點,並且根據生成文章的大標題與段落的小標題。
目前我使用Zapier的方式,是先上傳一個我在手機上錄的聲音檔(m4a格式)到Googl Drive,然後把聲音檔案串接到OpenAI的Whisper API作為語音辨識的手段,將手機上錄的聲音黨轉換成
大概是過了1個月,又開始使用mindsera這個產品。
透過Zapier建立出「思考自動化工具」真的很有意思。 透過將語音轉換為文字,每個人都可以更輕鬆自在地記錄自己的想法,進一步透過GPT4等AI,幫助我們找出自己談話逐字稿中的重點,並且根據生成文章的大標題與段落的小標題。
目前我使用Zapier的方式,是先上傳一個我在手機上錄的聲音檔(m4a格式)到Googl Drive,然後把聲音檔案串接到OpenAI的Whisper API作為語音辨識的手段,將手機上錄的聲音黨轉換成
大概是過了1個月,又開始使用mindsera這個產品。
你可能也想看
Google News 追蹤
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
很久很久沒有出來發文。 雖然說,用GPT寫字很快(是,它幫我迅速且高效解決了很多工作上的事情,各種類型的工作,尤其是大量資料的爬梳彙整與逐字稿等紀錄的內容歸類),不過那充其量或許只能說是文字的堆疊。我想,如果需要充分過腦,雖然說不上是文學創作,但還是試著用打的,或著至少,語音輸入的轉化也是一種相對
Thumbnail
  言語交流是很快速溝通的方式,有時大腦都還沒仔細思考好,話就講出去了。其實,同樣的意思,可以修飾得好一點再出去,這是使用文字的優點所在,多了一點思考的時間,結果可能就完全不一樣。當然,大家都會推崇那種連珠砲似的快嘴,表示這個人的反應很快,可以把對方完全壓制下來。但這樣的機關槍嘴,也不是處
Thumbnail
隨著生成式 AI 技術的進步,ChatGPT 的語音功能成為學習英文的最佳助手。本文將介紹如何透過 ChatGPT 進行語音互動,提升口說與聽力能力,並提供靈活的學習策略,幫助學習者在日常生活及商業場閤中自信應用英語。無論是基礎學習者還是專業人士,都能從中獲益匪淺。
Thumbnail
寫文章能讓我更加了解自己的想法是什麼。
Thumbnail
掌握 PRE 思維 是提升溝通力的關鍵,它能幫助你清楚表達自己、有效說服他人,並在職場和生活中發揮更好的表現。將這個簡單的框架應用於日常溝通,你會發現自己越來越自信,表達也更加順暢。從現在開始,讓 PRE 思維 成為你提升表達力的利器,開啟更加精彩的人生。
Thumbnail
本文介紹了一款高效的語音轉文字AI工具AudioPen,專為將語音筆記摘要成符合需求的文本而設計。利用其自動修正、潤飾文字及支援多語言功能,可快速將口述內容轉換成結構化的文本。無論是內容創作者、職場溝通者、口語翻譯,或是日常靈感紀錄,都能透過AudioPen提升效率和品質。
Thumbnail
不管科技如何發展,口語表達能力一直都是一項不可或缺的技能。無論是在職場、社交場合還是家庭生活中,良好的表達能力不僅能讓你更自信,還能開啟更多機會呢!✨✨
Thumbnail
大家安安,今天想分享一個近期嘗試,就是關於語音輸入 我平常會需要寫學校報告,也會寫寫文章,不過久了之後多少都會覺得手很痠 然後,有時候寫的時候,也會覺得就是手上打的跟不上腦中想的嘛
Thumbnail
隨著AI技術的進步,即時同步口譯機的設計將顯示出其獨特的優勢,特別是聲音模擬的能力。透過AI模擬個人聲音,未來的翻譯軟體將能夠精準捕捉使用者的口氣與情感,提供無縫的語言溝通經驗。然而,人類翻譯的專業與情感理解仍是AI難以取代的。本文探討了即時翻譯技術的未來及其勢必將改變國際會議和日常溝通的方式。
Thumbnail
據我所知,許多配音員老師是很反對去錄AI語音採樣的,但我則是抱持著不同的想法。昨天在九號群裡,和在線的伙伴們聊了一下我的想法,列出了很多應用場景,供大家自我判斷是否適合去錄AI語音採樣。 本篇內容是為剛從聲音培訓班結業、自我訓練一段時間、對聲音表演有興趣,但是不想成為配音員....等非職業配音員的
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
很久很久沒有出來發文。 雖然說,用GPT寫字很快(是,它幫我迅速且高效解決了很多工作上的事情,各種類型的工作,尤其是大量資料的爬梳彙整與逐字稿等紀錄的內容歸類),不過那充其量或許只能說是文字的堆疊。我想,如果需要充分過腦,雖然說不上是文學創作,但還是試著用打的,或著至少,語音輸入的轉化也是一種相對
Thumbnail
  言語交流是很快速溝通的方式,有時大腦都還沒仔細思考好,話就講出去了。其實,同樣的意思,可以修飾得好一點再出去,這是使用文字的優點所在,多了一點思考的時間,結果可能就完全不一樣。當然,大家都會推崇那種連珠砲似的快嘴,表示這個人的反應很快,可以把對方完全壓制下來。但這樣的機關槍嘴,也不是處
Thumbnail
隨著生成式 AI 技術的進步,ChatGPT 的語音功能成為學習英文的最佳助手。本文將介紹如何透過 ChatGPT 進行語音互動,提升口說與聽力能力,並提供靈活的學習策略,幫助學習者在日常生活及商業場閤中自信應用英語。無論是基礎學習者還是專業人士,都能從中獲益匪淺。
Thumbnail
寫文章能讓我更加了解自己的想法是什麼。
Thumbnail
掌握 PRE 思維 是提升溝通力的關鍵,它能幫助你清楚表達自己、有效說服他人,並在職場和生活中發揮更好的表現。將這個簡單的框架應用於日常溝通,你會發現自己越來越自信,表達也更加順暢。從現在開始,讓 PRE 思維 成為你提升表達力的利器,開啟更加精彩的人生。
Thumbnail
本文介紹了一款高效的語音轉文字AI工具AudioPen,專為將語音筆記摘要成符合需求的文本而設計。利用其自動修正、潤飾文字及支援多語言功能,可快速將口述內容轉換成結構化的文本。無論是內容創作者、職場溝通者、口語翻譯,或是日常靈感紀錄,都能透過AudioPen提升效率和品質。
Thumbnail
不管科技如何發展,口語表達能力一直都是一項不可或缺的技能。無論是在職場、社交場合還是家庭生活中,良好的表達能力不僅能讓你更自信,還能開啟更多機會呢!✨✨
Thumbnail
大家安安,今天想分享一個近期嘗試,就是關於語音輸入 我平常會需要寫學校報告,也會寫寫文章,不過久了之後多少都會覺得手很痠 然後,有時候寫的時候,也會覺得就是手上打的跟不上腦中想的嘛
Thumbnail
隨著AI技術的進步,即時同步口譯機的設計將顯示出其獨特的優勢,特別是聲音模擬的能力。透過AI模擬個人聲音,未來的翻譯軟體將能夠精準捕捉使用者的口氣與情感,提供無縫的語言溝通經驗。然而,人類翻譯的專業與情感理解仍是AI難以取代的。本文探討了即時翻譯技術的未來及其勢必將改變國際會議和日常溝通的方式。
Thumbnail
據我所知,許多配音員老師是很反對去錄AI語音採樣的,但我則是抱持著不同的想法。昨天在九號群裡,和在線的伙伴們聊了一下我的想法,列出了很多應用場景,供大家自我判斷是否適合去錄AI語音採樣。 本篇內容是為剛從聲音培訓班結業、自我訓練一段時間、對聲音表演有興趣,但是不想成為配音員....等非職業配音員的