asr

含有「asr」共 4 篇內容
全部內容
發佈日期由新至舊
付費限定
上一篇我們分享「【🧠 LLM智能應用系列】Function Call 智能指揮官:用 Spec-Kit 打造可靠的 AI 資料助理」,透過文字聊天的方式跟資料助理獲取最新資訊, 而這次的主題我們要將應用升級成即時語音互動 AI VoiceBot。 VoiceBot 很容易寫成 一堆 call
Thumbnail
阿Han-avatar-img
發文者
7 天前
音檔並非直接被大語言模型處理,而是先被轉換成文字,再被轉換成模型可理解的Token。本文探討音檔大小與Token數的關係,說明音檔容量與Token數並非直接相關,影響Token數的是轉換後的文字數量。
Thumbnail
冒冒-avatar-img
2025/05/03
光淺JY-avatar-img
發文者
2025/05/12
付費限定
上集回顧 上集我們提到「【語音辨識引擎sherpa-onnx CPU上篇】讓您輕鬆體驗語音辨識功能(Docker架設)」, 相信大家對於sherpa-onnx具備一定的基本概念並學會如何架設了吧! 如果還不會的兄弟姊妹們別擔心, 歡迎底下留言, 我們會盡量的協助您直到學會為止, 那麼雖然CPU版本
Thumbnail
還記得我們之前介紹過「【Google Colab Python系列】 初探Whisper: 來一段Youtube影片進行語音辨識吧!」這套語音辨識引擎, 那為什麼我們又要教這一套? 因為我們也可以將whisper的模型轉換成onnx的格式, 輕鬆移植到各種平台, 且效能更佳。 語音辨識的熱門組件之
Thumbnail