付費限定

【💎 語音辨識 - Whisper】 準確與否需要有一把 📏尺來衡量辨識率

更新於 2023/08/12閱讀時間約 7 分鐘

前面我們介紹了幾個關於Whisper的基本概念,這裡附上 🚀傳送門 ,歡迎好好閱讀一番,但我們除了學會如何用語音辨識的工具之外,「準確率」對我們來說也是一個非常重要的一環,但我們究竟應該要如何評估所謂的準確率呢? 不知道沒關係,當您看完這個篇章就能夠學會如何計算文字的「字元錯誤率」、「字詞錯誤率」...,非常值得您細細品嘗與學習,就讓我們往下一步步的完成評估準確率的程序吧!

這次的評估正確率的那把 📏尺我們會使用jiwer這一套來進行說明,它支援了多種的計算方式,包括: WER、CER、MER...等,那這些計算方式各有什麼不同呢? 就讓我們繼續看下去吧!

計算前必須知道的幾個錯誤指標

在進入到

以行動支持創作者!付費即可解鎖
本篇內容共 3192 字、0 則留言,僅發佈於💎 阿Han的Premium軟體技術棧你目前無法檢視以下內容,可能因為尚未登入,或沒有該房間的查看權限。
avatar-img
116會員
261內容數
哈囉,我是阿Han,是一位 👩‍💻 軟體研發工程師,喜歡閱讀、學習、撰寫文章及教學,擅長以圖代文,化繁為簡,除了幫助自己釐清思路之外,也希望藉由圖解的方式幫助大家共同學習,甚至手把手帶您設計出高品質的軟體產品。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
阿Han的沙龍 的其他內容
我們已經介紹過關於Transformer模型的平台「【Hugging Face】Ep.1 平凡人也能玩的起的AI平台」,而操作的過程中相信也會有不少玩家會遇到這樣的狀況,因此將遇到的問題整理並分享解決方法,讓需要的朋友可以參考一下。 問題 Input type (torch.FloatTen
回顧上一個篇章「【自然語言處理NLP】初探強大的工具庫spaCy, 讓機器讀懂我們的語言」我們初步學習spaCy這套工具,在尾端進行NER時我們也發現到現有的NER模型並沒有辦法滿足我們的需求, 導致有一些實體未被識別出來, 因此這次的任務就是設法進行訓練, 讓我們想要被識別的實體可以被進行識別。
上一篇章我們有提到「【AI幫幫忙】機器如何識別我們的特徵?關鍵的Named Entity Recognition(NER)技術」, 而NER是NLP自然語言處理的一部分, 而這一個篇章我們會以實作的形式來介紹自然語言處理中非常好用的一套工具「spaCy」,spaCy被廣泛用於各種NLP任務,包括自然
QA問答是自然語言處理NLP中蠻困難的一項任務, 必須從一段文本中識別出使用者的提問,像搜尋引擎就是一種QA的應用, 從眾多的問題中找答案, 那就讓我們親手來打造一下自己專屬的QA系統吧! 找看看有哪些可用模型 在「【Hugging Face】Ep.3 前往Dataset掏金趣」我們有介紹過Hu
這次來介紹一下NLP自然語言處理中重要的一個任務「命名實體識別(Named Entity Recognition)」, 這個任務主要識別出「人名」、「地名」、「公司」…等實體, 透過這些實體辨識結果, 可以近一步的理解意圖, 甚至判斷出該文章主要在講什麼重點…等。 關於更多NER的細節歡迎閱讀: 「
前面我們介紹了「【Hugging Face】Ep.1 平凡人也能玩的起的AI平台」, 我們都知道「詞」是NLP世界中的最小單元, 關於詞的知識歡迎參考: 簡單來說,主要的目的是將文本轉換為模型可以處理的數據, But…, 他主要的任務並不是像jieba…等斷詞器一樣, 而是很單純的扮演文字與模型的橋
我們已經介紹過關於Transformer模型的平台「【Hugging Face】Ep.1 平凡人也能玩的起的AI平台」,而操作的過程中相信也會有不少玩家會遇到這樣的狀況,因此將遇到的問題整理並分享解決方法,讓需要的朋友可以參考一下。 問題 Input type (torch.FloatTen
回顧上一個篇章「【自然語言處理NLP】初探強大的工具庫spaCy, 讓機器讀懂我們的語言」我們初步學習spaCy這套工具,在尾端進行NER時我們也發現到現有的NER模型並沒有辦法滿足我們的需求, 導致有一些實體未被識別出來, 因此這次的任務就是設法進行訓練, 讓我們想要被識別的實體可以被進行識別。
上一篇章我們有提到「【AI幫幫忙】機器如何識別我們的特徵?關鍵的Named Entity Recognition(NER)技術」, 而NER是NLP自然語言處理的一部分, 而這一個篇章我們會以實作的形式來介紹自然語言處理中非常好用的一套工具「spaCy」,spaCy被廣泛用於各種NLP任務,包括自然
QA問答是自然語言處理NLP中蠻困難的一項任務, 必須從一段文本中識別出使用者的提問,像搜尋引擎就是一種QA的應用, 從眾多的問題中找答案, 那就讓我們親手來打造一下自己專屬的QA系統吧! 找看看有哪些可用模型 在「【Hugging Face】Ep.3 前往Dataset掏金趣」我們有介紹過Hu
這次來介紹一下NLP自然語言處理中重要的一個任務「命名實體識別(Named Entity Recognition)」, 這個任務主要識別出「人名」、「地名」、「公司」…等實體, 透過這些實體辨識結果, 可以近一步的理解意圖, 甚至判斷出該文章主要在講什麼重點…等。 關於更多NER的細節歡迎閱讀: 「
前面我們介紹了「【Hugging Face】Ep.1 平凡人也能玩的起的AI平台」, 我們都知道「詞」是NLP世界中的最小單元, 關於詞的知識歡迎參考: 簡單來說,主要的目的是將文本轉換為模型可以處理的數據, But…, 他主要的任務並不是像jieba…等斷詞器一樣, 而是很單純的扮演文字與模型的橋
本篇參與的主題活動
在生成式AI與大型語言模型(Large Language Model, LLM)蓬勃發展下,有許多工具可以幫助我們學習與撰寫程式,這篇文章提供了實作範例與一些經驗,分享如何使用ChatGPT(免費的GPT-3.5)協助程式語言的學習,並且完成屬於自己的程式。
前幾個禮拜,AWS 舉行 Startup Day Taiwan。想當然爾,最熱門的主題非生成式 AI (Generative AI) 莫屬。既然 AWS 有現成的工具,身為一名工程師,自然看看無妨,這篇文章算是新手開箱文,會說明如何部署一套基礎模型,並使用 AWS SDK 與其互動。
前言 我在工作中沒有什麼機會接觸到機器學習,學生時期也沒有學習過相關知識。 作為一個業餘小白,我對機器學習非常感興趣。在自學的過程中,我逐漸意識到利用機器學習可以做很多有趣的事情。 因此,我決定嘗試使用 AWS SageMaker JumpStart 來實驗文字生成式繪圖 AI ,以了解機
最近玩到了一個我覺得很新奇有趣的軟體,叫做SillyTavern。 SillyTavern是專用於創建虛擬角色的AI聊天軟體,SillyTavern是TavernAI的分支,但SillyTavern走上了自己的路,加進了許多額外功能,並且仍在積極的持續更新中。 然後,可以色色!
「Prompt」這個詞是提示的意思,但為什麼需要提示呢? 當AI不理解我們的時候,勢必給出的回應並非準確的為我們解答,因此一個好的提示是非常重要的,就如同我們人與人之間的溝通一樣,如何將自己心裡的疑惑轉化成好的問題來提問對方,讓對方理解,進而給出一個明確的答案,這就是提示(Prompt)的重要性,對
在生成式AI與大型語言模型(Large Language Model, LLM)蓬勃發展下,有許多工具可以幫助我們學習與撰寫程式,這篇文章提供了實作範例與一些經驗,分享如何使用ChatGPT(免費的GPT-3.5)協助程式語言的學習,並且完成屬於自己的程式。
前幾個禮拜,AWS 舉行 Startup Day Taiwan。想當然爾,最熱門的主題非生成式 AI (Generative AI) 莫屬。既然 AWS 有現成的工具,身為一名工程師,自然看看無妨,這篇文章算是新手開箱文,會說明如何部署一套基礎模型,並使用 AWS SDK 與其互動。
前言 我在工作中沒有什麼機會接觸到機器學習,學生時期也沒有學習過相關知識。 作為一個業餘小白,我對機器學習非常感興趣。在自學的過程中,我逐漸意識到利用機器學習可以做很多有趣的事情。 因此,我決定嘗試使用 AWS SageMaker JumpStart 來實驗文字生成式繪圖 AI ,以了解機
最近玩到了一個我覺得很新奇有趣的軟體,叫做SillyTavern。 SillyTavern是專用於創建虛擬角色的AI聊天軟體,SillyTavern是TavernAI的分支,但SillyTavern走上了自己的路,加進了許多額外功能,並且仍在積極的持續更新中。 然後,可以色色!
「Prompt」這個詞是提示的意思,但為什麼需要提示呢? 當AI不理解我們的時候,勢必給出的回應並非準確的為我們解答,因此一個好的提示是非常重要的,就如同我們人與人之間的溝通一樣,如何將自己心裡的疑惑轉化成好的問題來提問對方,讓對方理解,進而給出一個明確的答案,這就是提示(Prompt)的重要性,對
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
語音辨識技術對於任何需要整理和表達想法的人都有著巨大的幫助。 透過這種技術,我們可以更有效地將腦海中的想法轉化為文字,從而將思緒組織得更為清晰。更重要的是,這種方式還可以助力我們增強自我語言能力,提升思考的深度和廣度。 自從我開始使用語音辨識技術以來,我的寫作流程完全改變,能更有效捕捉更多想法,更高
Thumbnail
有在看書的你,是否常常在讀完一本書後,感到腦袋混亂,無法記住或整合重要的觀點呢? 這篇文章要介紹給你「自言自語閱讀術」,能夠讓你不再僅僅是被動地吸收書本的內容,而是主動與其對話,讓閱讀不再是記憶的體力戰,而成為思考的智力賽。 而且很簡單!你只需要做出這3個簡單改變:
Thumbnail
不管你是創作者和學習者,都應該試試看用語音辨識來協助你學得更好與做得更多! 你需要的工具有 手機上能語音辨識的軟體 (我推薦DayOne) 一部想要深入學習的影片 (看看自己今天想學什麼) 一個計時器(我都用iPhone內建的計時器) 接下來跟著這3個步驟! 步驟1 - 高效率觀看影片,就是看3分鐘
Thumbnail
三段式寫作法與語音辨識絕對是所有追求高效能寫作的創作者必須理解與運用的工具。 這個結合了語音辨識與三段式寫作法的方式,可以解決創作效率低下,想法與文字脫節的問題。 這個獨特的方法,既能提升你的寫作速度,又能使你的想法更加結構化,進而提升你的創作質量。 在使用這種創作法已經實踐多次之後,我有以下三個重
Thumbnail
GPT4幫助我連續50天每日發表3篇文章🤯! 我現在每天早上都會花52分鐘與GPT-4一起寫作,把我日常的靈感轉為4篇500字的文章(如同你看到的這篇一樣)🥰! 你也想要利用AI幫忙你寫作嗎?掌握這3個關鍵因素是關鍵!
Thumbnail
語音辨識技術作為人工智能領域的重要領域之一,近年來取得了令人瞩目的發展。隨著自然語言處理、語音合成、聲學模型優化等方面的不斷進步,語音辨識技術正日益成熟且應用範圍不斷擴大。
Thumbnail
改變未來的聯繫方式 在當今數位化時代,互動語音辨識技術成為了改變行業運作方式的關鍵。這項技術的革命性應用使得企業能夠以更智能、便捷的方式與客戶互動,從而提升效率、降低成本,並提供卓越的用戶體驗。以下是幾個不同行業中的互動語音辨識應用案例,展示了這項技術在各個領域的嶄新應用。
Thumbnail
隨著人工智能技術的不斷發展,語音辨識AI作為其中的重要應用之一,正逐漸改變著我們的生活和工作方式。本文將介紹語音辨識AI的原理、應用以及其在不同領域的潛在價值。 嵐海智能|語意分析|智能客服|生成式AI
Thumbnail
你有嘗試過用語音辨識做筆記嗎? Macbook上的語音辨識功能非常好用!大大改變了我的筆記習慣!
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
語音辨識技術對於任何需要整理和表達想法的人都有著巨大的幫助。 透過這種技術,我們可以更有效地將腦海中的想法轉化為文字,從而將思緒組織得更為清晰。更重要的是,這種方式還可以助力我們增強自我語言能力,提升思考的深度和廣度。 自從我開始使用語音辨識技術以來,我的寫作流程完全改變,能更有效捕捉更多想法,更高
Thumbnail
有在看書的你,是否常常在讀完一本書後,感到腦袋混亂,無法記住或整合重要的觀點呢? 這篇文章要介紹給你「自言自語閱讀術」,能夠讓你不再僅僅是被動地吸收書本的內容,而是主動與其對話,讓閱讀不再是記憶的體力戰,而成為思考的智力賽。 而且很簡單!你只需要做出這3個簡單改變:
Thumbnail
不管你是創作者和學習者,都應該試試看用語音辨識來協助你學得更好與做得更多! 你需要的工具有 手機上能語音辨識的軟體 (我推薦DayOne) 一部想要深入學習的影片 (看看自己今天想學什麼) 一個計時器(我都用iPhone內建的計時器) 接下來跟著這3個步驟! 步驟1 - 高效率觀看影片,就是看3分鐘
Thumbnail
三段式寫作法與語音辨識絕對是所有追求高效能寫作的創作者必須理解與運用的工具。 這個結合了語音辨識與三段式寫作法的方式,可以解決創作效率低下,想法與文字脫節的問題。 這個獨特的方法,既能提升你的寫作速度,又能使你的想法更加結構化,進而提升你的創作質量。 在使用這種創作法已經實踐多次之後,我有以下三個重
Thumbnail
GPT4幫助我連續50天每日發表3篇文章🤯! 我現在每天早上都會花52分鐘與GPT-4一起寫作,把我日常的靈感轉為4篇500字的文章(如同你看到的這篇一樣)🥰! 你也想要利用AI幫忙你寫作嗎?掌握這3個關鍵因素是關鍵!
Thumbnail
語音辨識技術作為人工智能領域的重要領域之一,近年來取得了令人瞩目的發展。隨著自然語言處理、語音合成、聲學模型優化等方面的不斷進步,語音辨識技術正日益成熟且應用範圍不斷擴大。
Thumbnail
改變未來的聯繫方式 在當今數位化時代,互動語音辨識技術成為了改變行業運作方式的關鍵。這項技術的革命性應用使得企業能夠以更智能、便捷的方式與客戶互動,從而提升效率、降低成本,並提供卓越的用戶體驗。以下是幾個不同行業中的互動語音辨識應用案例,展示了這項技術在各個領域的嶄新應用。
Thumbnail
隨著人工智能技術的不斷發展,語音辨識AI作為其中的重要應用之一,正逐漸改變著我們的生活和工作方式。本文將介紹語音辨識AI的原理、應用以及其在不同領域的潛在價值。 嵐海智能|語意分析|智能客服|生成式AI
Thumbnail
你有嘗試過用語音辨識做筆記嗎? Macbook上的語音辨識功能非常好用!大大改變了我的筆記習慣!