免費的聲音轉文字只要三行程式碼

陳乃誠-avatar-img
發佈於筆記術 個房間
更新於 發佈於 閱讀時間約 2 分鐘

逐字稿

raw-image


如果你有會議紀錄要處理你會怎麼取得逐字稿?

如果你有一個聲音檔想轉逐字稿會怎麼做。

另外,只要你有逐字檔

你就可以做的事就很多了

文字的呈現方式

可以用心智圖

可以變成子彈筆記

當然也可以整理好逐字稿

在雲端硬碟安裝colaboratory

raw-image

先到雲端硬碟安裝colaboratory

https://workspace.google.com/u/0/marketplace/appfinder?host=drive

搜尋之後安裝這項服務

這項服務不用錢

raw-image
!pip install git+https://github.com/openai/whisper.git!sudo apt update
!sudo apt install ffmpeg

在程式碼輸入,這它跑一下

raw-image

他會開始在雲端安裝,大約4-5分鐘

接下來就是要放入音檔

raw-image


先在程式碼輸入

!whisper "123.m4a" --model medium

123.m4a是音檔的名稱

raw-image

接下來是下載聲音模組

raw-image

系統自選中文

raw-image

開始判讀音檔內容

判讀的內容精準度還很不錯

raw-image

判讀完成之後,出現的文字檔案

在自行下載需要的檔案即可

有了逐字稿

你就可以做很多事了

整理逐字稿

raw-image

接下來放進claude

prompt:整理成思維導圖,markdown語法呈現

接下來的產出

以下是根據文章內容整理成的思維導圖,使用markdown語法呈現:

# 原來大腦可以這樣練

## 作者簡介
- 台灣師範大學運動與腦科學研究團隊負責人
- 洪聰明教授

## 運動的效益
- 讓身體健康,心情舒暢
- 活化大腦記憶
- 開發學習潛能,提升學業成績

## 大腦執行長的觀念
- 透過台灣師範大學運動與腦科學團隊多年研究開發
- 融合運動處方、認知挑戰與心理技能的運動系統
- 以趣味有效的教學結合社會支持的核心架構

### 認識大腦CEO
- 前額頁皮層所控制的執行功能
- 決定行為模式的基礎,包含高層次認知(如推理、計劃等)
- 主導日常運作,影響決策判斷的速度和正確性

### 認識執行功能
- 極度複雜的認知過程,適應群體社會的重要能力
- 包含工作記憶、抑制慣性反應、注意力轉換等
- 讓我們可以依據當下狀況以更適合的方式應變
- 幫助在學業與職場上有良好表現,建立與維持人際關係

## 運動如何改善執行功能
- 增加環境刺激,產生神經可塑性
- 促進神經新生,提高神經細胞數量及運用效率

## 本書目標
- 讓孩子在享受運動樂趣的過程中建構成功心理技能的精神回路
- 面對各種挑戰時能保有積極正向的態度,有韌性、有創意地解決問題
- 達到健康、成功、快樂的人生終極目標

心智圖

下載成markdown檔案md檔匯入心智圖

raw-image


生活雜記.聲音.讀書.筆記
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
這篇文章介紹瞭如何做筆記和思考的方法,包括條列式書寫、回想老師的話、創造邏輯架構等。文章強調了寫筆記如何幫助思考,並提供了一些萬能筆記法的技巧。
這篇文章介紹了筆記的內容和筆記技巧,並提供了一些實用的方法。作者強調了筆記的目的、定期整理和複習以及實踐輸出導向。讀者可以透過本文學習到如何寫出有意義的筆記以及提高記憶力的方法。
這篇文章介紹瞭如何做筆記和思考的方法,包括條列式書寫、回想老師的話、創造邏輯架構等。文章強調了寫筆記如何幫助思考,並提供了一些萬能筆記法的技巧。
這篇文章介紹了筆記的內容和筆記技巧,並提供了一些實用的方法。作者強調了筆記的目的、定期整理和複習以及實踐輸出導向。讀者可以透過本文學習到如何寫出有意義的筆記以及提高記憶力的方法。
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
感覺需要對語音筆記如何更高效使用起來做更詳細的思考。 有了錄音卡以後,基本上重要的對話,我都會錄音,接著用AI拿到逐字稿。 但目前最大的問題,就是如何有效應用這些逐字稿。 我猜最關鍵的概念會是「復盤」。 一天可以發生很多場咪挺,但還是要靠自己手寫一次,把重要的資訊記錄下來,才
Thumbnail
要做會議記錄或課程筆記,想做逐字稿卻苦於打字速度不夠快嗎?錄音再慢慢回放浪費時間又容易恍神?這篇文章包你滿意,不用再浪費時間爬文了,你需要的逐字稿神器在這裡,保母級教學!
Thumbnail
我們前面幾篇已經講完TTS技術的一大半架構了,知道了如何將聲學特徵重建回音訊波形,也從中可以知道要是聲學特徵不完善,最終取得的結果也會不自然,剩下要探討該如何將文字轉換成聲學特徵,且能夠自然地表現停頓及細節變化,讓我們開始吧。
Thumbnail
  最近遇到一些人想做音訊的合成,我回答他或許可以從圖像風格轉換中找到些靈感,我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何,對於內部訓練邏輯及結構並沒有認真的去了解,現在剛好趁此機會好好的學習一下。
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
這篇文章介紹了幾種漢字轉拼音、拼音轉換工具的使用方法,並提供了簡單的操作步驟。工具包括漢字轉換、漢字拼音處理、臺羅POJ轉換器和讀音選擇工具。閱讀本文將有助於瞭解這些工具的使用方式,並學習如何在文書處理軟體中應用拼音標註。
Thumbnail
文字MP3專業版是簡單且強大的工具,會編輯文字就能創造出專業級配音。簡單 ﹑容易上手,像使用Word,無需剪輯經驗,輕鬆完成調整語速﹑插入空秒﹑插入背景音樂或音效等方面的製作。提供多種語言和配音員選擇,包括純正的臺灣口音。這個工具能應用於各種情境,如教育訓練簡報、有聲書、Podcast等。
Thumbnail
在簡報設計中,我們有時需要視覺化去表達「語音」的概念,例如是講者介紹、客戶回饋、問答環節等。利用在常見的語音圖案是可行的做法,只是人手自己畫耗費時間,生成式人工智能又未必一下子做到想要的效果。要解決問題,還有第三種可行辦法,免費可商用的字體,同樣可以助你快速建立語音圖案,兼且保留設計的自由度。
Thumbnail
【線上工具】whisper-jax 將影片轉換成純文字的線上工具,你可以直接上傳聲音檔案或是貼上Youtube連結,網站就會自動幫你轉換成純文字檔案,介介推薦的方式是直接貼上 Youtube 進行轉換,產出的文字稿除了可以整篇產出,也可以依照時間點,進行逐行的列表呈現,此外這個網站也支援直接透
Thumbnail
在數位時代,為了要應付各種場景和需求,所需要的檔案格式也不盡相同。撇除專用格式不談,日常使用的影音圖片格式,還要為個別種類去安裝對應的編輯軟體步驟多少會有些繁瑣。File Converter可以應付一些簡單的媒體格式轉換,過程中不用開啟任何軟體。可以省去不少步驟。
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
感覺需要對語音筆記如何更高效使用起來做更詳細的思考。 有了錄音卡以後,基本上重要的對話,我都會錄音,接著用AI拿到逐字稿。 但目前最大的問題,就是如何有效應用這些逐字稿。 我猜最關鍵的概念會是「復盤」。 一天可以發生很多場咪挺,但還是要靠自己手寫一次,把重要的資訊記錄下來,才
Thumbnail
要做會議記錄或課程筆記,想做逐字稿卻苦於打字速度不夠快嗎?錄音再慢慢回放浪費時間又容易恍神?這篇文章包你滿意,不用再浪費時間爬文了,你需要的逐字稿神器在這裡,保母級教學!
Thumbnail
我們前面幾篇已經講完TTS技術的一大半架構了,知道了如何將聲學特徵重建回音訊波形,也從中可以知道要是聲學特徵不完善,最終取得的結果也會不自然,剩下要探討該如何將文字轉換成聲學特徵,且能夠自然地表現停頓及細節變化,讓我們開始吧。
Thumbnail
  最近遇到一些人想做音訊的合成,我回答他或許可以從圖像風格轉換中找到些靈感,我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何,對於內部訓練邏輯及結構並沒有認真的去了解,現在剛好趁此機會好好的學習一下。
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
這篇文章介紹了幾種漢字轉拼音、拼音轉換工具的使用方法,並提供了簡單的操作步驟。工具包括漢字轉換、漢字拼音處理、臺羅POJ轉換器和讀音選擇工具。閱讀本文將有助於瞭解這些工具的使用方式,並學習如何在文書處理軟體中應用拼音標註。
Thumbnail
文字MP3專業版是簡單且強大的工具,會編輯文字就能創造出專業級配音。簡單 ﹑容易上手,像使用Word,無需剪輯經驗,輕鬆完成調整語速﹑插入空秒﹑插入背景音樂或音效等方面的製作。提供多種語言和配音員選擇,包括純正的臺灣口音。這個工具能應用於各種情境,如教育訓練簡報、有聲書、Podcast等。
Thumbnail
在簡報設計中,我們有時需要視覺化去表達「語音」的概念,例如是講者介紹、客戶回饋、問答環節等。利用在常見的語音圖案是可行的做法,只是人手自己畫耗費時間,生成式人工智能又未必一下子做到想要的效果。要解決問題,還有第三種可行辦法,免費可商用的字體,同樣可以助你快速建立語音圖案,兼且保留設計的自由度。
Thumbnail
【線上工具】whisper-jax 將影片轉換成純文字的線上工具,你可以直接上傳聲音檔案或是貼上Youtube連結,網站就會自動幫你轉換成純文字檔案,介介推薦的方式是直接貼上 Youtube 進行轉換,產出的文字稿除了可以整篇產出,也可以依照時間點,進行逐行的列表呈現,此外這個網站也支援直接透
Thumbnail
在數位時代,為了要應付各種場景和需求,所需要的檔案格式也不盡相同。撇除專用格式不談,日常使用的影音圖片格式,還要為個別種類去安裝對應的編輯軟體步驟多少會有些繁瑣。File Converter可以應付一些簡單的媒體格式轉換,過程中不用開啟任何軟體。可以省去不少步驟。