本文將實測,使用同一組圖像,用不同的OCR模型來辨識看成效如何,主要介紹如何從資料夾中,讀取圖片檔中的檔名來比對tesseract OCR的結果是否一致,若結果不同就記錄其錯誤位置及次數,統計最後的誤判率及誤判字的總次數。
圖片檔中的檔名由事先整理出正確結果,比對OCR模型用。
Tesseract OCR模型介紹圖
tesseract OCR模型 github網址
圖像中的OCR,字體與我上一篇文章相同,文章連結如下
[OpenCV][Python]OCR分割及增加間隔[雙排文字]
結果圖
目前使用的經驗上,覺得Best模型對較清楚的字體辨識度較高,Fast模型對於不清楚的辨識率反而不錯。若後續還有什麼心得在分享
Best模型
Fast模型