常常在學習的道路上發現資訊不完整、教學不清楚、工具不好用的疑難雜症? 放心, 在「🔒 阿Han的軟體心法實戰營」都能夠得到完整的一套學習脈落, 而我們在實戰方面也都會提供簡易、清晰、一鍵啟動的乾淨環境讓您不用拘束害怕的Try Error, 人生就是需要不斷的試誤才能夠探索出屬於自己的一條路, 我們就是在建立這樣的沙盒練習場, 讓您踏入職場或者接案時能夠更加順手, 這多虧了「【Docker 容器化】初探微服務時代的虛擬化技術」的技術, 讓我們對於軟體開發不再那麼傷痛, 期待您對於此工具包的使用心得與回饋, 歡迎留言或者討論區互相探討。
還記得我們之前介紹過「【Google Colab Python系列】 初探Whisper: 來一段Youtube影片進行語音辨識吧!」這套語音辨識引擎, 那為什麼我們又要教這一套? 因為我們也可以將whisper的模型轉換成onnx的格式, 輕鬆移植到各種平台, 且效能更佳。
再次感謝您購買我們的學習包, 在這邊您將學習到關於kaldi語音辨識引擎sherpa-onnx的實戰技能, 本篇教程主要教您如何建置GPU版本的sherpa-onnx, 讓您的辨識速度飛快提昇。
上回我們提到「【語音辨識引擎sherpa-onnx CPU上篇】讓您輕鬆體驗語音辨識功能」, 相信大家對於sherpa-onnx具備一定的基本概念並學會如何架設了吧! 如果還不會的兄弟姊妹們別擔心, 歡迎底下留言, 我們會盡量的協助您直到學會為止, 那麼雖然CPU版本架設的很快, 但實際的系統環境需要處理的辨識量會非常的龐大, 單純只考CPU顯然不夠用, 因此本章節就來教您如何用Docker來打包GPU的版本。
🔥 如果您已經讀過上篇的朋友們, 這個篇章只要尋找「🔥」的標誌進行重點加強即可。
# 建置映像檔
docker compose build
# 啟動服務
docker compose up -d
# 打開網頁
http://localhost:6006
# 切換到Upload頁籤, 上傳模型裡面的wav檔
這邊的核心程式碼在「NonStreamingServer」這個類別, 接收、辨識、回傳三大功能皆在此完成, 因此我們針對這裡的程式碼進行解析。
本章節教您輕鬆開箱語音辨識組件, 而網路上也提供了各式各樣的預訓練模型, 假設我們只想要使用, 那麼我們可以去下載這些模型來掛載, 那如果我們想要自行訓練或者微調, 接下來的篇章我們也會教您如何去進行這些過程, 當我們學會使用也會訓練模型之後, 最重要的就是資料了, 就像我們把飲水器接好, 也會使用冷水熱水之後, 最重要的還是「水」, 它的重要程度就像我們的「資料」, 要如何大量的蒐集這些資料及管控品質就是另外一門學問了, 關於資料處理, 我們也推薦您閱讀以下幾個篇章:
懶人包裡面有精美的教學文件、封裝的Dockerfile、一鍵啟動的docker compose, 讓您一手掌握最新軟體技術, 語音辨識 + Docker容器化。
常常在學習的道路上發現資訊不完整、教學不清楚、工具不好用的疑難雜症? 放心, 在「🔒 阿Han的軟體心法實戰營」都能夠得到完整的一套學習脈落, 而我們在實戰方面也都會提供簡易、清晰、一鍵啟動的乾淨環境讓您不用拘束害怕的Try Error, 人生就是需要不斷的試誤才能夠探索出屬於自己的一條路, 我們就是在建立這樣的沙盒練習場, 讓您踏入職場或者接案時能夠更加順手, 這多虧了「【Docker 容器化】初探微服務時代的虛擬化技術」的技術, 讓我們對於軟體開發不再那麼傷痛, 期待您對於此工具包的使用心得與回饋, 歡迎留言或者討論區互相探討。
還記得我們之前介紹過「【Google Colab Python系列】 初探Whisper: 來一段Youtube影片進行語音辨識吧!」這套語音辨識引擎, 那為什麼我們又要教這一套? 因為我們也可以將whisper的模型轉換成onnx的格式, 輕鬆移植到各種平台, 且效能更佳。
再次感謝您購買我們的學習包, 在這邊您將學習到關於kaldi語音辨識引擎sherpa-onnx的實戰技能, 本篇教程主要教您如何建置GPU版本的sherpa-onnx, 讓您的辨識速度飛快提昇。
上回我們提到「【語音辨識引擎sherpa-onnx CPU上篇】讓您輕鬆體驗語音辨識功能」, 相信大家對於sherpa-onnx具備一定的基本概念並學會如何架設了吧! 如果還不會的兄弟姊妹們別擔心, 歡迎底下留言, 我們會盡量的協助您直到學會為止, 那麼雖然CPU版本架設的很快, 但實際的系統環境需要處理的辨識量會非常的龐大, 單純只考CPU顯然不夠用, 因此本章節就來教您如何用Docker來打包GPU的版本。
🔥 如果您已經讀過上篇的朋友們, 這個篇章只要尋找「🔥」的標誌進行重點加強即可。
# 建置映像檔
docker compose build
# 啟動服務
docker compose up -d
# 打開網頁
http://localhost:6006
# 切換到Upload頁籤, 上傳模型裡面的wav檔
這邊的核心程式碼在「NonStreamingServer」這個類別, 接收、辨識、回傳三大功能皆在此完成, 因此我們針對這裡的程式碼進行解析。
本章節教您輕鬆開箱語音辨識組件, 而網路上也提供了各式各樣的預訓練模型, 假設我們只想要使用, 那麼我們可以去下載這些模型來掛載, 那如果我們想要自行訓練或者微調, 接下來的篇章我們也會教您如何去進行這些過程, 當我們學會使用也會訓練模型之後, 最重要的就是資料了, 就像我們把飲水器接好, 也會使用冷水熱水之後, 最重要的還是「水」, 它的重要程度就像我們的「資料」, 要如何大量的蒐集這些資料及管控品質就是另外一門學問了, 關於資料處理, 我們也推薦您閱讀以下幾個篇章:
懶人包裡面有精美的教學文件、封裝的Dockerfile、一鍵啟動的docker compose, 讓您一手掌握最新軟體技術, 語音辨識 + Docker容器化。