方格精選

寫作高效技巧!用 AI 語音輸入+ AI 整理,讓寫作更輕鬆

更新 發佈閱讀 10 分鐘


寫作其實不是一件容易的事情,除了要有靈感外,長時間撰寫其實對於手部也是很大的負擔,如果你平日工作又是高強度使用鍵盤更是如此。

這邊我會分享我自己如何使用 AI 來幫助我更輕鬆跟高效的產出,除了輕鬆外,也讓效率大幅的提升。

本篇內容以 Mac 使用者角度來撰寫,尤其是前半段語音輸入部分我是使用 Mac 功能,Windows 不確定是否有類似工具或服務,如果有歡迎大家留言分享,這樣 Windows 系統使用者應該會很有幫助。


1.AI 語音輸入:Whisper 鍵盤+Raycast

Whisper 是 OpenAI 推出的一個語音轉文字模型,除了開源外,效果非常好,是我用過的語音轉文字精準度最高的,唯一的費用是 OpenAI API,但是這是以量計價,通常來說我一個月幾十元台幣就非常多了,比起多數訂閱服務更划算,不用時就不算費用。

因為這是模型,所以通常來說會自己架設跟串接,或是透過別人架設跟串接的工具來使用,我會知道這工具是看了「一口新飯」這位 YouTuber 的分享,他的影片分享了他如何利用這工具,以及免費提供大家他寫好的蘋果「捷徑 Shortcuts」。


Whisper閃念筆記|鍵盤下載 (完全免費)
https://onenewbite.gumroad.com/l/whisper



詳細的使用情境與方法可以參考他的影片,我這邊主要分享我如何在電腦上使用這工具搭配 Raycast 這款工具,讓寫文變得超方便。

Raycast 是一款用來提高 Mac 工作效率的工具,他除了可以快速協助你搜尋電腦中的檔案,更能方便的設定各種快捷鍵來開啟你要使用的工具與網頁。

我這邊做的就是把「 Whisper 鍵盤的捷徑 Shortcuts」設定一組快速開啟的快捷鍵,這樣就能一鍵打開 Whisper 鍵盤,馬上對著麥克風說話就等於開始撰寫內容了。

這邊來分享使用步驟

A.到 Raycast 官網下載安裝 APP,直接點選「Download for Mac」

官網:https://www.raycast.com/

Raycast 快捷鍵設定步驟教學,內有詳細設定流程畫面


設定完成後,我們就可以按下設定好的快捷鍵 ( Hotkey ),這時就會自動跳出下面畫面這個視窗,這時候他就開始錄製了,我們只要對著麥克風說話就能錄製進去,這邊錄製完成就按下「停止」,這功能會叫做鍵盤是因為他的產出是文字,所以他是在你按下停止後就直接把語音轉成文字。

所以通常會需要一點點時間,以我來說,就算是 10 分鐘語音內容,最久也一分鐘內都能會完成,完成後的內容會直接複製到「剪貼簿」中,你隨意找個筆記工具貼上即可。

raw-image

下面這段內容是我使用 Whisper 鍵盤唸出來的,我一個字都沒有改,大家覺得效果如何呢?

「這是Whisper的鍵盤功能。 現在打開之後呢,我就等於在輸入我的內容。 或者是說,如果你把它比喻成,過去寫文章的時候等於你現在正在用鍵盤打字。 但因為用講的速度絕對會比你手動打字的速度快非常多。 那現在我講的這一段,大家看到這一段文字內容呢,全部都是我講出來的。」( 為了測試真實性,所以就隨意講,有些冗言贅字還請包含 )

但是大家會發現,文字準確度是高,但是還是有些小缺點,像是「標點符號沒有全形」、「中文與英數字中間沒半形空格」,這應該會是很多人在意的,接下來就會分享我製作的一個 GPTs,專門把轉換的內容變成更好讀的內容。

不過語音輸入的小缺點就是「環境」,太吵雜不適合,或是你在辦公室用語音轉換可能會干擾到其他人,所以更適合在家工作或安靜環境使用。

補充:這邊語音錄音的長度建議可以控制在 10 分鐘內,太長有時文字太長,AI 後續不會整理內容,而且 10 分鐘能講的文字其實已經很多了,不過如果你是想要用來協助寫書這類長文,那可以分段來轉換最好。


2.GPTs:文字格式化助手

針對這個問題我製作了一個文字格式化助手,可以把所有我貼給他的文字轉換成我規劃的格式,這邊會分享我如何建立 GPTs,跟分享我設定的「Instructions」,如果你無法使用 GPTs,也可以把 Instructions 當 Prompt 來使用。

首先是來到 ChatGPT 頁面,你可以在左邊欄位中到到「探索更多的 GPTs」並點擊

raw-image


點擊後除了可以找到別人建立 GPTs 外,也能在畫面右上看到「+創建 GPT」

raw-image


點擊進入後的設定方式有二種

A.你不知道怎麼開始,推薦用對話方式來熟悉

raw-image


這邊左邊選擇「Create」,會開啟一個對話頁面,雖然是英文,但不用害怕,你使用任何語言跟他溝通都可以,就當作是使用一般的 ChatGPT,也能告訴他回應你要用什麼語言。

這其實跟很多工具建立個人頁面很像,但對話的體驗卻很不同,你可以跟他溝通你的需求,說明你要一個什麼樣的機器人,他就會設定可以達成這個效果的指令到 Instructions 中,甚至他會針對你的需求幫你發想 GPTs 名稱跟建立適合的大頭貼。

這邊大家可以體驗看看,當你不知道怎麼設定時,用溝通的方式,直接把你的需求告訴他,如果有細微的地方不符合需求,都可以後續在 Instructions 修改。


B.直接透過 Configure 設定

raw-image


這邊就是可以直接設定你的 Instructions ,我也會分享我自己的設定,大家可以看到畫面左邊有幾個名稱,我分別解釋一下



Configure 名詞解釋

Name:你設計的 GPTs 名稱

Description:GPTs 的簡介

Instructions:GPTs 該如何運行的指令

Conversation starters:建議使用者可以使用的 Prompt

Knowledge:你可以上傳圖片、PDF、文檔資料給他當資料庫

Capabilities:這裡有三個功能,分別是
1.Web Browsing:可以讓你的 GPTs 具備連網功能
2.DALL·E Image Generation:圖片生成功能
3.Code Interpreter:允許 GPTs 執行程式碼,能分析數據、處理上傳文件、算數等

Actions:串接 API 達成更多功能,像是串接 Zapier 這類自動化工具



這邊分享我自己的 Instructions 詳細內容,你可以直接使用或參考修改

你的角色是中文文本內容整理助手。當提供給你一段冗長的文本時
1.你需要將其重新組織成結構良好的段落,適當分段,段落間要有空白行。
2.將文中所有的空格替換成逗號(,)
3.中文和英數字之間都要使用半形空格
4.每個段落結尾使用句號(。)
5.所有回應都應該使用正體中文呈現
6.針對我的內容提供我列點摘要和頻率高的關鍵詞整理
7.重整後的文本不要精簡,請保持原有內容




接著我們就把我上面唸的那一段內容丟進去給大家看看效果

raw-image


大家覺得效果如何呢?上面 Instructions 的第六點其實不一定要放,如果你只要他幫你重新排版可以不加,我自己是希望他幫我列出一些摘要跟使用頻率比較高的關鍵字,用來當作我文章摘要、標籤參考使用。


你也可以直接體驗看看我設計的 GPTs

GPTs:文字格式化助手
https://chat.openai.com/g/g-GKjC2o76J-wen-zi-ge-shi-hua-zhu-shou


以上需花費成本:
1.ChatGPT Plus 20美金/月

2.GPT3.5 API 費用,依照用量計價,每1K字元輸入 0.0015 美元,每1K字元輸出 0.002 美元,所以實際使用不算貴,你是商用應該都划算


創作邦沙龍訂閱已經開啟,每月更新內容會有設計分析、個人品牌經驗、AI工具應用技巧、設計師資源等更多豐富深度分享,訂閱者還有專屬討論區跟活動。換算下來最多只要每月 $120 元,一杯星巴克的價格就能支持我!



Hi,我是Kevin ,我平時會在方格子分享各類關於設計、AI、個人品牌、高效工作相關主題內容,歡迎大家追蹤我的沙龍,我也有推出訂閱制服務,裡面有更深度的內容,大家可以透過創作邦沙龍找到。

我建立創作邦分享各種設計、創作、工具介紹等內容,也整理了各種相關資源連結,如果你對這類資源感興趣,可以逛逛,你想追蹤更即時的訊息可以看我的社群平台

如果你有任何關於設計、個人品牌、AI 應用的問題,都歡迎來信或傳訊息跟我討論。如果是合作討論,則可以來信 info@creatorhome.tw,也可以訂閱「創作邦電子報」收到我的每週內容整理跟分享。

我也開設了 Youtube 頻道,歡迎訂閱追蹤:訂閱頻道

(歡迎分享至社群。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來源,及附上原文連結)

留言
avatar-img
創作邦|設計X工具X品牌的沙龍
19.5K會員
163內容數
創作邦致力分享設計新知、創作工具、高效工作方法,我們的沙龍提供各種給設計師和創作者的實用知識與資源,如果你付費訂閱我們,還會提供你更深度的內容分享、專屬討論區、會員購買數位商品限定優惠等福利。
你可能也想看
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
本文介紹如何設置OpenAI API密鑰並使用Whisper API轉寫音訊檔案。文章詳細說明了轉寫單個音訊檔案,以及將長音訊分割並轉寫的過程。透過範例演示,讀者可以學習如何將音訊轉寫為文字,提高工作效率。
Thumbnail
本文介紹如何設置OpenAI API密鑰並使用Whisper API轉寫音訊檔案。文章詳細說明了轉寫單個音訊檔案,以及將長音訊分割並轉寫的過程。透過範例演示,讀者可以學習如何將音訊轉寫為文字,提高工作效率。
Thumbnail
本文提供如何使用 Google Colab 結合 Faster Whisper 來提升語音辨識速度與準確性,包含安裝指南與使用方法。探索如何將語音轉換為文本,並對檔案進行不同格式的輸出。
Thumbnail
本文提供如何使用 Google Colab 結合 Faster Whisper 來提升語音辨識速度與準確性,包含安裝指南與使用方法。探索如何將語音轉換為文本,並對檔案進行不同格式的輸出。
Thumbnail
本篇筆記了如何使用Google Colab和OpenAI的Whisper Large V3進行免費且開源的語音辨識。涵蓋從基礎設定到實際運用的步驟,適合初學者和技術愛好者輕鬆學習語音辨識技術。
Thumbnail
本篇筆記了如何使用Google Colab和OpenAI的Whisper Large V3進行免費且開源的語音辨識。涵蓋從基礎設定到實際運用的步驟,適合初學者和技術愛好者輕鬆學習語音辨識技術。
Thumbnail
在人工智慧蓬勃發展的時代,掌握 AI 就像擁有一支全能的高效團隊,能夠協助你初步建構思路,理清脈絡,讓你能更具創意地突破舒適圈,進一步演進現有的事物。AI 的應用範疇多不勝數,今天我們要分享的是從文字內容出發,探討人類如何與 AI 進行合作,以及現今已有哪些軟體能提供相應的功能。讓我們一起來了解吧!
Thumbnail
在人工智慧蓬勃發展的時代,掌握 AI 就像擁有一支全能的高效團隊,能夠協助你初步建構思路,理清脈絡,讓你能更具創意地突破舒適圈,進一步演進現有的事物。AI 的應用範疇多不勝數,今天我們要分享的是從文字內容出發,探討人類如何與 AI 進行合作,以及現今已有哪些軟體能提供相應的功能。讓我們一起來了解吧!
Thumbnail
大名鼎鼎的openai推出Whisper-large-v2 AI 的第二版,可以用來製作屬於自己的自動影片上字幕程式,就讓我們一起來看看吧!
Thumbnail
大名鼎鼎的openai推出Whisper-large-v2 AI 的第二版,可以用來製作屬於自己的自動影片上字幕程式,就讓我們一起來看看吧!
Thumbnail
在我們這個充斥資訊與忙碌的時代,寫作仍然是一個無可取代的自我表達和信息傳遞工具。不過,傳統的寫作方式經常令人覺得耗時和負擔重大。《從語音到文章:運用AI工具,激增寫作效率》系列文將為你展示如何利用現代科技,尤其是AI工具,來顯著提升寫作的效率和質量。
Thumbnail
在我們這個充斥資訊與忙碌的時代,寫作仍然是一個無可取代的自我表達和信息傳遞工具。不過,傳統的寫作方式經常令人覺得耗時和負擔重大。《從語音到文章:運用AI工具,激增寫作效率》系列文將為你展示如何利用現代科技,尤其是AI工具,來顯著提升寫作的效率和質量。
Thumbnail
透過Zapier建立出「思考自動化工具」真的很有意思。 透過將語音轉換為文字,每個人都可以更輕鬆自在地記錄自己的想法,進一步透過GPT4等AI,幫助我們找出自己談話逐字稿中的重點,並且根據生成文章的大標題與段落的小標題。
Thumbnail
透過Zapier建立出「思考自動化工具」真的很有意思。 透過將語音轉換為文字,每個人都可以更輕鬆自在地記錄自己的想法,進一步透過GPT4等AI,幫助我們找出自己談話逐字稿中的重點,並且根據生成文章的大標題與段落的小標題。
Thumbnail
目前我使用Zapier的方式,是先上傳一個我在手機上錄的聲音檔(m4a格式)到Googl Drive,然後把聲音檔案串接到OpenAI的Whisper API作為語音辨識的手段,將手機上錄的聲音黨轉換成
Thumbnail
目前我使用Zapier的方式,是先上傳一個我在手機上錄的聲音檔(m4a格式)到Googl Drive,然後把聲音檔案串接到OpenAI的Whisper API作為語音辨識的手段,將手機上錄的聲音黨轉換成
Thumbnail
Hi,大家好,我是茶桁。 其实到第18章的时候,我们处理文本的内容就全部都结束了,从本节课开始,我们要开始学习如何处理音频和图像。 我不知道有没有人和我一样的习性,就是比起视频和音频文件来说,还是跟喜欢看文本文件。这其中最主要的一个原因就是因为文本内容我们可以准确定位,而对于文本内容的接收速度还
Thumbnail
Hi,大家好,我是茶桁。 其实到第18章的时候,我们处理文本的内容就全部都结束了,从本节课开始,我们要开始学习如何处理音频和图像。 我不知道有没有人和我一样的习性,就是比起视频和音频文件来说,还是跟喜欢看文本文件。这其中最主要的一个原因就是因为文本内容我们可以准确定位,而对于文本内容的接收速度还
Thumbnail
這個篇章主要是讓我們能夠熟悉Whisper的安裝與使用方式,並簡單的對Youtube影片進行線上翻譯的工作,主軸在於了解一下整個Whisper使用方式到底是簡單還是複雜,就讓我們一起來玩玩看吧! 在這之前我們還是說一下Whisper它是什麼樣的一個工具,能夠做什麼? Whisper 是OpenAI
Thumbnail
這個篇章主要是讓我們能夠熟悉Whisper的安裝與使用方式,並簡單的對Youtube影片進行線上翻譯的工作,主軸在於了解一下整個Whisper使用方式到底是簡單還是複雜,就讓我們一起來玩玩看吧! 在這之前我們還是說一下Whisper它是什麼樣的一個工具,能夠做什麼? Whisper 是OpenAI
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News