更新於 2024/09/26閱讀時間約 1 分鐘

[OpenCV][Python]實測tesseract OCR的Best模型與Fast模型

本文將實測,使用同一組圖像,用不同的OCR模型來辨識看成效如何,主要介紹如何從資料夾中,讀取圖片檔中的檔名來比對tesseract OCR的結果是否一致,若結果不同就記錄其錯誤位置及次數,統計最後的誤判率及誤判字的總次數。

圖片檔中的檔名由事先整理出正確結果,比對OCR模型用。


Tesseract OCR模型介紹圖

來自官方資料

來自官方資料


tesseract OCR模型 github網址

圖像中的OCR,字體與我上一篇文章相同,文章連結如下

[OpenCV][Python]OCR分割及增加間隔[雙排文字]


結果圖

目前使用的經驗上,覺得Best模型對較清楚的字體辨識度較高,Fast模型對於不清楚的辨識率反而不錯。若後續還有什麼心得在分享

Best模型

Fast模型


分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.