🗣️ 語音辨識的筆記如何做卡片入庫?

更新於 2023/07/30閱讀時間約 6 分鐘


本文章分享我於2023年7月30對語音辨識與卡片筆記法,用語音的直接思考。

語音識別與筆記庫的融合問題

:我覺得這個(語音辨識的筆記如何做卡片入庫?)碰觸到一個問題,就是如果用語音辨識去辨識很長的段落的話, 那麼語音辨識APP會拿到一段很長的文字。

:這段很長的文字,具體要怎麼去融合進原本的卡片筆記庫?這個是一主要的技術問題。

:然後, 因為一般我們(用正常語速對語音辨識)弄出來大概會至少有五百到一千個 字,然後由於講話的時候又會比較多的冗言贅字,所以(GPT4要處理)也會有一些困難, 這個是(我們要語音辨識來做筆記寫文章)要處理的地方。

語音識別文稿的整理與切割

: 第二個(問題)是說,你講話的過程,可能會產生很多不同的想法。

:這些想法本身,你是要(1) 照著原本它語音辨識的結果,還是說(2) 我們在(做卡片)入庫的時候重新寫?

:如果要做重新寫的話,其實應該是語音辨識完之後,盡量保留全部逐字稿, 然後去(根據講的內容)分小塊。

:那可是如果你要(根據講的內容)分小塊的話,會有一個困難,就是那個關鍵字不太能做。就是說,一次如果既要去做分割(有多少想法),還要去做判斷(想法的內容),那其實(實際上處理逐字稿的文本)就會很慢。

: 所以可能要建立一個(處理語音逐字稿的)標準,就是一次只負責一個功能。就是說如果是語音辨識的話,那一開始我們就用字數的長度,先大概切一下,然後拆解完,以後變成多塊筆 記。

語音識別稿與筆記庫的整合

:那再進一步去做,可是我覺得好像這個(語音辨識逐字稿)也要保留原文,對不對?

:所以我覺得可能要開obsidian裡面一個新的(筆記)類型,這個類型是就是語音辨識稿使用(用一個emoji是一個人在講話),然後裡面載入的是我們講話的原稿,然後還有語音辨識後的結果。

:然後這些結果我們就在上面編輯,把它切成小塊的,然後小塊的那就等於說我是自己講話 然後得到的結果,然後這些小塊的東西,我們也是以大概兩三百個字,用三百個字好了,當作是一個標準。然後我去切割,那摩一個檔案如果是一千到一千兩百個 字,我們就把它切成三塊或四塊。(實際執行上,150-250字就能切一段)

從語音識別到關鍵字的提煉

:那有三四塊(切割好的筆記)之後,這個源頭的筆記,我接下來在重寫的時候,我們要有聚焦的點。

:(聚焦的點) 就是去把它跟我們筆記庫裡面的一些關鍵字做關聯, 因為你語音辨識的結果不會有關鍵字,所以你第一步就是語音辨識完然後進行重。

:然後重寫就是看著這個(逐字稿),然後去把它分成三段或四段,然後有了這些想法之後我們就把它歸到關鍵字裡面,然後歸到關鍵字裡面以後呢,你就必須進一步去想說那我這個下一步要怎麼延伸。

分級思維與問題解決

:那目前的做法是,我們在講那個話題的時候有分一級二級三級,然後一級就是最大的話題,二級就是我們採用的討論的觀點或角度, 然後三級的話就要把它的目的給標出來。

:因為一個話題就是說一級跟二級話題它組織 起來會像是一種思維上的工具,然後 這個工具本身它應該是要能夠解一個問題。

大型思維導圖的關鍵字與概念理解

:那這個就是講到那個大型思維導圖的邏輯了

:就是說我們用關鍵字分門別類的話,你會發現一開始它都是用名詞關鍵字來做階層分類。

:因為我們理解東西是需要靠概念去理解,就是說我的概念如果越銳利我們的思考也會越銳利

卡片筆記法與閱讀理解與寫作素材的獲取

:可是要能夠寫到一個卡片的等級的話,你要去回答說,學這個東西它目標是能夠用來滿足 什麼,或者是說解決什麼問題。

:例如用盧曼的卡片筆記法的話,要可以達到一個目標是「規模閱讀術」。

:規模閱讀術就是說,我今天在讀書,或者把文章裡面的內容,想要納為己有做成寫作素材的過程中,我們要一個好的編排方式。

:或者是說要一個好的筆記入庫的工作流,那你就能看到你平常閱讀的一個過程產出的心得。

:它們是在之後都可以變成一些寫作的基本材料,然後我們藉由重新讀取來發揮它裡面的價值。

輸入與輸出的時間管理

: 所以以這個角度來想的話,好像也要去分(輸入與輸出模式來做時間管理)。

: 比如說這個禮拜,我們就是以輸入為主,所以可以去一直讀一直讀,(然後造大量的筆記存入Obsidian筆記庫裡面)。

:然後下個禮拜,如果我以輸出為主,那就應該把精神花在都去構造內容出來。

:那我覺得可能要有這樣子,一週是輸入,一週是輸出,這樣子的心態會比較正確,因為輸入跟輸出本身是蠻 不同的工作。

細分的工作流與資料處理

:在輸出的時候其實也要經過處理。

:所以如果我們再把它做細一點的話,其實就可以決定說,這一週都是來累積素材,然後下一週都是在處理跟輸出素材。

:這邊講的處理就是說,我把卡片歸庫,然後輸出就是說,因為我歸庫了以後,我看到那個思想在我設定的卡片盒的脈絡的價值以後,我要把它去進一步再換成把它的價值再提煉出來。

寫作策略與反饋循環

:就是說我會用短篇寫作五百字的跟長篇寫作一千字的(方式),去把同樣的想法做不同的寫作,然後這樣子寫作之後呢,我就有一些文章可以去市場上看看大家的反應,然後它也同樣幫我累積素材庫,也可以去啟發說我往下一個地方寫的話,細節要怎麼弄。

:所以你本身要有一個類似現在的卡片盒的結構,這樣可以協助你不僅儲存和整理知識,而且也能促進深度思考和長期學習。

:藉由卡片盒的使用,你能夠更有效地應對不斷變化的學習環境和挑戰,將所學的知識轉化為可用的素材,進一步應用到寫作和其他創造性工作中。

覺得這個語音辨識有趣嗎?你可以

  • 追蹤我的方格子 ,看更多「原子寫作」與「卡片盒筆記法」相關的文章。
  • 追蹤「次原子想法」專題,看更多短但實用的簡單想法。
  • 追蹤「原紫短文」專題,看如何將簡單想法組合,實踐原子寫作原則。
  • 追蹤「Me, Myself & AI」專題,看看AI幫助我寫出的各種隨筆,或許有啟發。
  • 訂閱「 紫式書齋」電子報,了解數位寫作,體驗世界文化啟發,掌握數據產業趨勢
raw-image


avatar-img
527會員
1.8K內容數
Outline as Content
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
前面我們介紹了幾個關於Whisper的基本概念,這裡附上 🚀傳送門 ,歡迎好好閱讀一番,但我們除了學會如何用語音辨識的工具之外,「準確率」對我們來說也是一個非常重要的一環,但我們究竟應該要如何評估所謂的準確率呢? 不知道沒關係,當您看完這個篇章就能夠學會如何計算文字的「字元錯誤率」、「字詞錯誤率」
Thumbnail
假設我們有一段雙聲道的音檔, 正常來說透過whisper進行語音辨識時都是以整段音檔進行辨識,但我們若想將左右聲道分離進行辨識的話就得對音檔進行音訊處理了。 怎麼做呢? 比較簡單的方式就是透過音訊處理工具將音檔進行左右聲道的分離,再獨立的進行辨識即可。 這次會將雙聲道音檔透過pydub這套音訊處理工
Thumbnail
語音辨識技術作為人工智能領域的重要領域之一,近年來取得了令人瞩目的發展。隨著自然語言處理、語音合成、聲學模型優化等方面的不斷進步,語音辨識技術正日益成熟且應用範圍不斷擴大。
Thumbnail
改變未來的聯繫方式 在當今數位化時代,互動語音辨識技術成為了改變行業運作方式的關鍵。這項技術的革命性應用使得企業能夠以更智能、便捷的方式與客戶互動,從而提升效率、降低成本,並提供卓越的用戶體驗。以下是幾個不同行業中的互動語音辨識應用案例,展示了這項技術在各個領域的嶄新應用。
Thumbnail
隨著人工智能技術的不斷發展,語音辨識AI作為其中的重要應用之一,正逐漸改變著我們的生活和工作方式。本文將介紹語音辨識AI的原理、應用以及其在不同領域的潛在價值。 嵐海智能|語意分析|智能客服|生成式AI
Thumbnail
由黃韻玲主導的25周年張雨生紀念音樂會剛剛在上個月舉辦,自己很喜歡他的歌,但是不希望藉由他人的口中唱出,因此我選擇在今天發表曾經為他做過的一首小詩,也搜尋了不少我認為還不錯的影片,分享給也很想念或是喜歡他歌聲的人,期盼台灣的流行歌曲有一日也能在國際舞台上屹立不搖!
Thumbnail
現在語音辨識越來越普及,這真是太好了!只要開口說話就可以完成很多操作。 活用Python套件與ChatGPT學習,就像是在開車時使用GPS導航一樣,可以幫助我們更快地到達目的地,而且還不容易迷路!
Thumbnail
歡迎來到Kangaroo的blog! 今天要來介紹一款超實用的AI語音辨識系統~ 不管是國小老師、華語老師、英語老師、閩南語老師,甚或是學生都可以運用這個網站來進行發音檢核。 對於老師而言,可以更快速地知道學生有那些發音偏誤。 對於學生而言,可以更知道自己那些發音需要再次加強與練習。
Thumbnail
不確定性的風險與時間密切相關,時間越短,不確定性的風險越小,時間越長,不確定性的風險越大,目前看到企業的營收在1~2個月內還是可以維持一定的水準,不會立即明顯下滑,但很難預知未來1~2年的營收是否下滑
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
前面我們介紹了幾個關於Whisper的基本概念,這裡附上 🚀傳送門 ,歡迎好好閱讀一番,但我們除了學會如何用語音辨識的工具之外,「準確率」對我們來說也是一個非常重要的一環,但我們究竟應該要如何評估所謂的準確率呢? 不知道沒關係,當您看完這個篇章就能夠學會如何計算文字的「字元錯誤率」、「字詞錯誤率」
Thumbnail
假設我們有一段雙聲道的音檔, 正常來說透過whisper進行語音辨識時都是以整段音檔進行辨識,但我們若想將左右聲道分離進行辨識的話就得對音檔進行音訊處理了。 怎麼做呢? 比較簡單的方式就是透過音訊處理工具將音檔進行左右聲道的分離,再獨立的進行辨識即可。 這次會將雙聲道音檔透過pydub這套音訊處理工
Thumbnail
語音辨識技術作為人工智能領域的重要領域之一,近年來取得了令人瞩目的發展。隨著自然語言處理、語音合成、聲學模型優化等方面的不斷進步,語音辨識技術正日益成熟且應用範圍不斷擴大。
Thumbnail
改變未來的聯繫方式 在當今數位化時代,互動語音辨識技術成為了改變行業運作方式的關鍵。這項技術的革命性應用使得企業能夠以更智能、便捷的方式與客戶互動,從而提升效率、降低成本,並提供卓越的用戶體驗。以下是幾個不同行業中的互動語音辨識應用案例,展示了這項技術在各個領域的嶄新應用。
Thumbnail
隨著人工智能技術的不斷發展,語音辨識AI作為其中的重要應用之一,正逐漸改變著我們的生活和工作方式。本文將介紹語音辨識AI的原理、應用以及其在不同領域的潛在價值。 嵐海智能|語意分析|智能客服|生成式AI
Thumbnail
由黃韻玲主導的25周年張雨生紀念音樂會剛剛在上個月舉辦,自己很喜歡他的歌,但是不希望藉由他人的口中唱出,因此我選擇在今天發表曾經為他做過的一首小詩,也搜尋了不少我認為還不錯的影片,分享給也很想念或是喜歡他歌聲的人,期盼台灣的流行歌曲有一日也能在國際舞台上屹立不搖!
Thumbnail
現在語音辨識越來越普及,這真是太好了!只要開口說話就可以完成很多操作。 活用Python套件與ChatGPT學習,就像是在開車時使用GPS導航一樣,可以幫助我們更快地到達目的地,而且還不容易迷路!
Thumbnail
歡迎來到Kangaroo的blog! 今天要來介紹一款超實用的AI語音辨識系統~ 不管是國小老師、華語老師、英語老師、閩南語老師,甚或是學生都可以運用這個網站來進行發音檢核。 對於老師而言,可以更快速地知道學生有那些發音偏誤。 對於學生而言,可以更知道自己那些發音需要再次加強與練習。
Thumbnail
不確定性的風險與時間密切相關,時間越短,不確定性的風險越小,時間越長,不確定性的風險越大,目前看到企業的營收在1~2個月內還是可以維持一定的水準,不會立即明顯下滑,但很難預知未來1~2年的營收是否下滑