語音辨識

含有「語音辨識」共 70 篇內容
全部內容
發佈日期由新至舊
分享如何使用Perplexity AI將MP3音頻轉換成吸引人的Facebook貼文,並提供提升互動率的進階技巧、其他AI轉錄工具的比較,以及最大化音頻轉錄品質的實用技巧。文中也包含了2025年Facebook演算法的最新趨勢、內容重構的高階技巧、跨平臺內容適配策略、成效追蹤與持續優化的建議。
Thumbnail
含 AI 應用內容
#方格新手#AI#Perplexity
音檔並非直接被大語言模型處理,而是先被轉換成文字,再被轉換成模型可理解的Token。本文探討音檔大小與Token數的關係,說明音檔容量與Token數並非直接相關,影響Token數的是轉換後的文字數量。
Thumbnail
冒冒-avatar-img
2025/05/03
果然是工程師的背景?XD
光淺JY-avatar-img
發文者
2025/05/12
冒冒 我不是工程師出身的,感謝我們家工程師很努力的幫助我成長🤣🤣🤣
這篇文章探討AI如何影響企業和個人,並特別介紹李宏毅教授的觀點。文章涵蓋AI帶來的效率提升、成就感下降的矛盾,以及中高階主管如何聰明運用AI,避免偏見和錯誤決策。此外,文章強調理解AI原理的重要性,並鼓勵持續學習以適應AI時代。最後,文章宣傳作者的AI課程和社群媒體平臺。
Thumbnail
近年來,隨著人工智慧技術的快速發展,AI語音助手市場競爭愈加激烈。其中專注於汽車語音助手的 Cerence 公司,因與 NVIDIA 擴大合作的消息而成為焦點。然而,這家市值不到 6 億美元的公司能否成為長期贏家,還是僅僅在市場投機中昙花一現,仍有待觀察。以下將深入分析 Cerence 的商業模式、
Thumbnail
我們在「【語音辨識引擎sherpa-onnx GPU下篇】讓您體驗更快的語音辨識功能」建置環境的過程中預到了這樣的錯誤訊息: RuntimeError: /onnxruntime_src/onnxruntime/core/session/provider_bridge_ort.cc: 1209
Thumbnail
阿Han-avatar-img
發文者
2024/08/17
是的 善用工具讓我們更具價值
要做會議記錄或課程筆記,想做逐字稿卻苦於打字速度不夠快嗎?錄音再慢慢回放浪費時間又容易恍神?這篇文章包你滿意,不用再浪費時間爬文了,你需要的逐字稿神器在這裡,保母級教學!
Thumbnail
付費限定
上集回顧 上集我們提到「【語音辨識引擎sherpa-onnx CPU上篇】讓您輕鬆體驗語音辨識功能(Docker架設)」, 相信大家對於sherpa-onnx具備一定的基本概念並學會如何架設了吧! 如果還不會的兄弟姊妹們別擔心, 歡迎底下留言, 我們會盡量的協助您直到學會為止, 那麼雖然CPU版本
Thumbnail
還記得我們之前介紹過「【Google Colab Python系列】 初探Whisper: 來一段Youtube影片進行語音辨識吧!」這套語音辨識引擎, 那為什麼我們又要教這一套? 因為我們也可以將whisper的模型轉換成onnx的格式, 輕鬆移植到各種平台, 且效能更佳。 語音辨識的熱門組件之
Thumbnail
本文主要使用SpeechRecognition來做一個簡單的語音辨識,使用pyqt5介面呈現。 按下Start Recording,開始錄音,並顯示請開始說話。然後按鈕名改名Stop 在按下Stop Recording,稍等片刻後就會呈現出辨識結果​ 程式範例 import sys i
Thumbnail