whisper

含有「whisper」共 12 篇內容
全部內容
發佈日期由新至舊
分享整套做電影用的 AI 工具組,包括圖像、影片、BGM、歌曲、人聲、字幕等。 可以 0 成本製作電影部件、甚至整部影片,且不被特定生態系綁定。 靠這些工具做出的短片,入選多個國際影展,顯現 AI 在影視業可能的應用。
Thumbnail
從零到影展還願意把流程攤開分享真的很強,謝謝你讓更多人敢踏出第一步,期待你下一部更瘋的作品。
移幣-avatar-img
發文者
2 天前
邏輯村村民 謝謝鼓勵 我崇尚的開源精神,就是公開成品、過程、甚至心法 這樣下一個人就不用重複踩坑,也能降低大眾入行的門檻 下一部可能要很久,人生清單有太多目標 XD
這篇文章介紹一個自動音檔轉錄工具,利用FFmpeg處理音檔,並結合OpenAI的Whisper API進行轉錄,有效提升轉錄速度和穩定性。此工具具備檔案大小與時長控制、靜音對齊切割、輕量化轉檔及多工併發等功能,大幅優化轉錄流程。
音檔並非直接被大語言模型處理,而是先被轉換成文字,再被轉換成模型可理解的Token。本文探討音檔大小與Token數的關係,說明音檔容量與Token數並非直接相關,影響Token數的是轉換後的文字數量。
Thumbnail
冒冒-avatar-img
2025/05/03
果然是工程師的背景?XD
光淺JY-avatar-img
發文者
2025/05/12
冒冒 我不是工程師出身的,感謝我們家工程師很努力的幫助我成長🤣🤣🤣
還記得我們之前介紹過「【Google Colab Python系列】 初探Whisper: 來一段Youtube影片進行語音辨識吧!」這套語音辨識引擎, 那為什麼我們又要教這一套? 因為我們也可以將whisper的模型轉換成onnx的格式, 輕鬆移植到各種平台, 且效能更佳。 語音辨識的熱門組件之
Thumbnail
1. 在命令提示字元輸入nvidia-smi  ∟確認自己電腦真的有NVIDIA顯卡,同時更重要的是看自己顯卡的CUDA Version版本  ∟我顯卡的CUDA Version版本是12.1 2. 到PyTorch官網 https://pytorch.org/ 3. 滾輪滾一下找到INST
Thumbnail
付費限定
假設我們有一段雙聲道的音檔, 正常來說透過whisper進行語音辨識時都是以整段音檔進行辨識,但我們若想將左右聲道分離進行辨識的話就得對音檔進行音訊處理了。 怎麼做呢? 比較簡單的方式就是透過音訊處理工具將音檔進行左右聲道的分離,再獨立的進行辨識即可。 這次會將雙聲道音檔透過pydub這套音訊處理工
Thumbnail
上一篇「【Google Colab Python系列】 初探Whisper: 來對一段Youtube影片進行辨識吧!」我們介紹了Whisper的基本用法及功能,這次我們除了語音辨識之外,還要下載辨識後的字幕檔,我想這對於我們常常看到沒有字幕的影片,若想要進行辨識與翻譯時非常有幫助。 這次的篇章主要做
Thumbnail
這個篇章主要是讓我們能夠熟悉Whisper的安裝與使用方式,並簡單的對Youtube影片進行線上翻譯的工作,主軸在於了解一下整個Whisper使用方式到底是簡單還是複雜,就讓我們一起來玩玩看吧! 在這之前我們還是說一下Whisper它是什麼樣的一個工具,能夠做什麼? Whisper 是OpenAI
Thumbnail
「杜氏」是日本酒藏裡的首席釀酒師,其下配有其他的熟練工匠——「藏人」。 據說「杜氏」一詞源自中國最早釀出酒的杜康之名。 (也有說法認為事實上是杜康的妻子釀造出酒。) 日文中還留有「刀自」(日文中與杜氏發音相同,文字不同) 這一古老的詞語,是「夫人」 或者「女士」的文言用語。在古代,釀酒曾經.....
Thumbnail
也許大家對日本酒界大前輩 秋山裕一 認識不深,但大家一定聽過他畢生心血的名字、歷史首枚「低發泡性酵母」酵母菌株~「協會701號」。秋山裕一(Yuichi Akiyama)1924年出生於山梨縣的酒造家庭。1947年畢業於東京大學,在被尊稱為「日本酒博士」的坂口謹一郎教授其發酵科學課下學習了5年...
Thumbnail