🗣️ 語音辨識的筆記如何做卡片入庫?

更新於 發佈於 閱讀時間約 6 分鐘


本文章分享我於2023年7月30對語音辨識與卡片筆記法,用語音的直接思考。

語音識別與筆記庫的融合問題

:我覺得這個(語音辨識的筆記如何做卡片入庫?)碰觸到一個問題,就是如果用語音辨識去辨識很長的段落的話, 那麼語音辨識APP會拿到一段很長的文字。

:這段很長的文字,具體要怎麼去融合進原本的卡片筆記庫?這個是一主要的技術問題。

:然後, 因為一般我們(用正常語速對語音辨識)弄出來大概會至少有五百到一千個 字,然後由於講話的時候又會比較多的冗言贅字,所以(GPT4要處理)也會有一些困難, 這個是(我們要語音辨識來做筆記寫文章)要處理的地方。

語音識別文稿的整理與切割

: 第二個(問題)是說,你講話的過程,可能會產生很多不同的想法。

:這些想法本身,你是要(1) 照著原本它語音辨識的結果,還是說(2) 我們在(做卡片)入庫的時候重新寫?

:如果要做重新寫的話,其實應該是語音辨識完之後,盡量保留全部逐字稿, 然後去(根據講的內容)分小塊。

:那可是如果你要(根據講的內容)分小塊的話,會有一個困難,就是那個關鍵字不太能做。就是說,一次如果既要去做分割(有多少想法),還要去做判斷(想法的內容),那其實(實際上處理逐字稿的文本)就會很慢。

: 所以可能要建立一個(處理語音逐字稿的)標準,就是一次只負責一個功能。就是說如果是語音辨識的話,那一開始我們就用字數的長度,先大概切一下,然後拆解完,以後變成多塊筆 記。

語音識別稿與筆記庫的整合

:那再進一步去做,可是我覺得好像這個(語音辨識逐字稿)也要保留原文,對不對?

:所以我覺得可能要開obsidian裡面一個新的(筆記)類型,這個類型是就是語音辨識稿使用(用一個emoji是一個人在講話),然後裡面載入的是我們講話的原稿,然後還有語音辨識後的結果。

:然後這些結果我們就在上面編輯,把它切成小塊的,然後小塊的那就等於說我是自己講話 然後得到的結果,然後這些小塊的東西,我們也是以大概兩三百個字,用三百個字好了,當作是一個標準。然後我去切割,那摩一個檔案如果是一千到一千兩百個 字,我們就把它切成三塊或四塊。(實際執行上,150-250字就能切一段)

從語音識別到關鍵字的提煉

:那有三四塊(切割好的筆記)之後,這個源頭的筆記,我接下來在重寫的時候,我們要有聚焦的點。

:(聚焦的點) 就是去把它跟我們筆記庫裡面的一些關鍵字做關聯, 因為你語音辨識的結果不會有關鍵字,所以你第一步就是語音辨識完然後進行重。

:然後重寫就是看著這個(逐字稿),然後去把它分成三段或四段,然後有了這些想法之後我們就把它歸到關鍵字裡面,然後歸到關鍵字裡面以後呢,你就必須進一步去想說那我這個下一步要怎麼延伸。

分級思維與問題解決

:那目前的做法是,我們在講那個話題的時候有分一級二級三級,然後一級就是最大的話題,二級就是我們採用的討論的觀點或角度, 然後三級的話就要把它的目的給標出來。

:因為一個話題就是說一級跟二級話題它組織 起來會像是一種思維上的工具,然後 這個工具本身它應該是要能夠解一個問題。

大型思維導圖的關鍵字與概念理解

:那這個就是講到那個大型思維導圖的邏輯了

:就是說我們用關鍵字分門別類的話,你會發現一開始它都是用名詞關鍵字來做階層分類。

:因為我們理解東西是需要靠概念去理解,就是說我的概念如果越銳利我們的思考也會越銳利

卡片筆記法與閱讀理解與寫作素材的獲取

:可是要能夠寫到一個卡片的等級的話,你要去回答說,學這個東西它目標是能夠用來滿足 什麼,或者是說解決什麼問題。

:例如用盧曼的卡片筆記法的話,要可以達到一個目標是「規模閱讀術」。

:規模閱讀術就是說,我今天在讀書,或者把文章裡面的內容,想要納為己有做成寫作素材的過程中,我們要一個好的編排方式。

:或者是說要一個好的筆記入庫的工作流,那你就能看到你平常閱讀的一個過程產出的心得。

:它們是在之後都可以變成一些寫作的基本材料,然後我們藉由重新讀取來發揮它裡面的價值。

輸入與輸出的時間管理

: 所以以這個角度來想的話,好像也要去分(輸入與輸出模式來做時間管理)。

: 比如說這個禮拜,我們就是以輸入為主,所以可以去一直讀一直讀,(然後造大量的筆記存入Obsidian筆記庫裡面)。

:然後下個禮拜,如果我以輸出為主,那就應該把精神花在都去構造內容出來。

:那我覺得可能要有這樣子,一週是輸入,一週是輸出,這樣子的心態會比較正確,因為輸入跟輸出本身是蠻 不同的工作。

細分的工作流與資料處理

:在輸出的時候其實也要經過處理。

:所以如果我們再把它做細一點的話,其實就可以決定說,這一週都是來累積素材,然後下一週都是在處理跟輸出素材。

:這邊講的處理就是說,我把卡片歸庫,然後輸出就是說,因為我歸庫了以後,我看到那個思想在我設定的卡片盒的脈絡的價值以後,我要把它去進一步再換成把它的價值再提煉出來。

寫作策略與反饋循環

:就是說我會用短篇寫作五百字的跟長篇寫作一千字的(方式),去把同樣的想法做不同的寫作,然後這樣子寫作之後呢,我就有一些文章可以去市場上看看大家的反應,然後它也同樣幫我累積素材庫,也可以去啟發說我往下一個地方寫的話,細節要怎麼弄。

:所以你本身要有一個類似現在的卡片盒的結構,這樣可以協助你不僅儲存和整理知識,而且也能促進深度思考和長期學習。

:藉由卡片盒的使用,你能夠更有效地應對不斷變化的學習環境和挑戰,將所學的知識轉化為可用的素材,進一步應用到寫作和其他創造性工作中。

覺得這個語音辨識有趣嗎?你可以

  • 追蹤我的方格子 ,看更多「原子寫作」與「卡片盒筆記法」相關的文章。
  • 追蹤「次原子想法」專題,看更多短但實用的簡單想法。
  • 追蹤「原紫短文」專題,看如何將簡單想法組合,實踐原子寫作原則。
  • 追蹤「Me, Myself & AI」專題,看看AI幫助我寫出的各種隨筆,或許有啟發。
  • 訂閱「 紫式書齋」電子報,了解數位寫作,體驗世界文化啟發,掌握數據產業趨勢
raw-image


avatar-img
534會員
1.8K內容數
Outline as Content
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
寫筆記是一種輸入知識的方法,目的是為了能在未來輸出想法,其價值取決於是否能對輸出產生幫助。如果筆記之間沒有任何關聯,未來看到時就不容易能形成完整的內容
卡片,看起來僅是相當普通的東西,我們未必會認真地去看待它。 我們也許較少地想到,卡片是否可能作為一種促進思考的工具,從而改變我們的思考方式。如此地普通的卡片,其實蘊含著關於想法如何創新的深刻意涵。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在AI說書 - 從0開始 - 42中,見識了 Tokenizer 做的事情了,以下來羅列幾個要點: 它將原始文字轉成小寫 有可能將原始文字再進行切割 通常 T
Thumbnail
在傳統的筆記方法中存在著分類僵化和過度依賴關鍵字的問題。卡片筆記以一張卡片一個知識,確保知識的獨立性,並且建立知識間的多重連接,形成網狀結構。 這本書介紹了用卡片筆記做知識管理的技巧,幫助大家將零散的知識系統化,從而在需要時能夠迅速提取並應用。
Thumbnail
  我們在語音初探篇提到TTS的流程可以分成三個部分 :輸入前處理、預測音訊特徵、語音重建,其中輸入前處理的部分上兩篇已經處理完,在進入預測音訊特徵前,讓我們先來理解最後的語音重建部分。
Thumbnail
上篇我們簡單的了解了 TTS 想要達到的目標,但是對於訓練資料的處理、網路架構、損失函數、輸出分析等考慮到篇幅尚未解釋清楚,這篇將針對訓練資料處理中的文字部分進行詳細說明,讓我們開始吧。
Thumbnail
書 少年時,我是這麼想得: 閱讀能使得我有書寫的能力。 學習如何闡述得更好,啟發下一個題目的靈感。 然而,書寫太困難了。 所以開始拿著筆記本抄錄喜歡的文句。 抄寫是非常重要的,能一字一句地去汲取著文字, 像是用另外一個方式解讀,挖掘一個又一個沒留意的含義。 但現在看來變成了一種很笨拙地
從卡片盒筆記法(zettelkasten)的運作原理來思考AI時代中「學習」的意義
經過大約兩年使用筆記軟體的過程,赫然發現,不少筆記軟體都將「雙向鏈接」與「卡片盒筆記法」掛鉤,但若仔細看盧曼的操作方法,「雙向鏈接」與盧曼對於卡片筆記的連結方式無法直接地等同起來。 觀察盧曼為筆記編號的方法,雖然其核心也是連結,但其連結筆記的方式有其特定的邏輯。 其實筆記的「編碼」關注的就是邏輯
Thumbnail
當我們在進行「語音辨識」的應用開發時, 首先會面臨一個問題, 那就是究竟要怎麼知道哪些段落是「人在說話的區段」, 精確的標示出這些區段之後, 我們除了可以儲存成純對話的段落, 還可以做出時間軸的字幕檔, 應用非常廣泛, 因此學會怎麼用VAD是進入語音領域非常重要的其中一個環節。 VAD代表
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
寫筆記是一種輸入知識的方法,目的是為了能在未來輸出想法,其價值取決於是否能對輸出產生幫助。如果筆記之間沒有任何關聯,未來看到時就不容易能形成完整的內容
卡片,看起來僅是相當普通的東西,我們未必會認真地去看待它。 我們也許較少地想到,卡片是否可能作為一種促進思考的工具,從而改變我們的思考方式。如此地普通的卡片,其實蘊含著關於想法如何創新的深刻意涵。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在AI說書 - 從0開始 - 42中,見識了 Tokenizer 做的事情了,以下來羅列幾個要點: 它將原始文字轉成小寫 有可能將原始文字再進行切割 通常 T
Thumbnail
在傳統的筆記方法中存在著分類僵化和過度依賴關鍵字的問題。卡片筆記以一張卡片一個知識,確保知識的獨立性,並且建立知識間的多重連接,形成網狀結構。 這本書介紹了用卡片筆記做知識管理的技巧,幫助大家將零散的知識系統化,從而在需要時能夠迅速提取並應用。
Thumbnail
  我們在語音初探篇提到TTS的流程可以分成三個部分 :輸入前處理、預測音訊特徵、語音重建,其中輸入前處理的部分上兩篇已經處理完,在進入預測音訊特徵前,讓我們先來理解最後的語音重建部分。
Thumbnail
上篇我們簡單的了解了 TTS 想要達到的目標,但是對於訓練資料的處理、網路架構、損失函數、輸出分析等考慮到篇幅尚未解釋清楚,這篇將針對訓練資料處理中的文字部分進行詳細說明,讓我們開始吧。
Thumbnail
書 少年時,我是這麼想得: 閱讀能使得我有書寫的能力。 學習如何闡述得更好,啟發下一個題目的靈感。 然而,書寫太困難了。 所以開始拿著筆記本抄錄喜歡的文句。 抄寫是非常重要的,能一字一句地去汲取著文字, 像是用另外一個方式解讀,挖掘一個又一個沒留意的含義。 但現在看來變成了一種很笨拙地
從卡片盒筆記法(zettelkasten)的運作原理來思考AI時代中「學習」的意義
經過大約兩年使用筆記軟體的過程,赫然發現,不少筆記軟體都將「雙向鏈接」與「卡片盒筆記法」掛鉤,但若仔細看盧曼的操作方法,「雙向鏈接」與盧曼對於卡片筆記的連結方式無法直接地等同起來。 觀察盧曼為筆記編號的方法,雖然其核心也是連結,但其連結筆記的方式有其特定的邏輯。 其實筆記的「編碼」關注的就是邏輯
Thumbnail
當我們在進行「語音辨識」的應用開發時, 首先會面臨一個問題, 那就是究竟要怎麼知道哪些段落是「人在說話的區段」, 精確的標示出這些區段之後, 我們除了可以儲存成純對話的段落, 還可以做出時間軸的字幕檔, 應用非常廣泛, 因此學會怎麼用VAD是進入語音領域非常重要的其中一個環節。 VAD代表