[OpenCV][Python]實測tesseract OCR縮放到最佳高度可提高辨識率嗎?

螃蟹_crab

發佈於[Python][OpenCV]學習心得筆記

2024/09/25 更新2024/09/25 發佈閱讀 1 分鐘

在Tesseract的討論論壇中看到一篇文章，有人研究tesseract在文字高度在30~33pixl~內辨識率是最佳的。

本文就將來實作看看，拿出之前實驗用的OCR圖檔來跑跑看。

實驗內容

縮放與不縮放的圖片在tesseract OCR結果比較

圖片縮放流程

先讀取圖片中OCR的高度，取中位數。
按照比例縮放圖片
確認縮放後的圖片中的OCR高度是否在區間內
辨識文字

縮放的程式範例

import os
import pytesseract
import time
import numpy as np
from collections import Counter
import cv2

def obj_area(img):
    num_labels, labels, stats, _ = cv2.connectedComponentsWithStats(img, connectivity=8)
    components = []
    ocr_components = []
    if num_labels < 2: # 若全黑的就跳過
        return None,None
    for i in range(1, num_labels):  # 跳過背景
        x, y, w, h, area = stats[i]
        components.append([x, y, w, h, area])
    components.sort(key=lambda c: c[0])  # 按 x 座標排序
    for state in components:
        _,_,w,h,area = state
        # ocr_components.append(f'{ocr}, 寬:{w}, 高 : {h} 面積:{area}')
        ocr_components.append((w,h,area))
    return ocr_components

def resize_img(img,ocr_h):
    H,W = img.shape[:2]
    target_height = 31
    # 計算目標高度
    target_ratio = target_height / ocr_h
    if target_ratio > ocr_h :
        resize_interpolation = cv2.INTER_CUBIC
    else:
        resize_interpolation = cv2.INTER_AREA
    # 根據計算出的高度進行縮放
    scaled_region = cv2.resize(img, (int(W*target_ratio), int(H*target_ratio)), interpolation = resize_interpolation)
    return scaled_region
    
def main():
    # 圖檔路徑
    img_path = "圖片路徑"
    # tesserac檔案路徑
    pytesseract.pytesseract.tesseract_cmd = r"tesserac檔案路徑"
    config = f'--oem 3 --psm 7'
    # 讀取圖檔
    img = cv2.imread(img_path)
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    labels = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
    # 計算OCR高度
    h_res = obj_area(labels) 
    ocr_h = int(np.median([pos[1] for pos in h_res]))
    print(f'原先ocr_h:{ocr_h}')
    # 縮放圖片
    image_resize = resize_img(labels,ocr_h)
    # 計算縮放後的OCR高度
    resize_h_res = obj_area(image_resize)
    ocr_h_resize = int(np.median([pos[1] for pos in resize_h_res]))
    print(f'縮放後的ocr_h:{ocr_h_resize}')
    ocr_text = pytesseract.image_to_string(image_resize, lang="eng_Best", config=config)
    print(ocr_text)

if __name__ == "__main__":
    main()

結果圖

eng_Best模型

原圖：錯誤率35%

原圖

縮放後 : 錯誤率40%

eng_fast模型

原圖：錯誤率10%

縮放後：錯誤率 6%

結論

模型對於某些字體或者是大小會直接影響到辨識率，官方雖然說Best模型辨識率較佳，但在一些使用上的經驗來講，某些狀況則不一定是最佳，如這次實驗fast模型就好很多。

兩個模型在縮放後的結果也不盡相同，但在fast模型是有明顯提高辨識率的。

螃蟹_crab的沙龍[Python][OpenCV]學習心得筆記AOI開發應用

留言

螃蟹_crab的沙龍

164會員

320內容數

本業是影像辨識軟體開發，閒暇時間進修AI相關內容，將學習到的內容寫成文章分享。興趣是攝影，踏青，探索未知領域。人生就是不斷的挑戰及自我認清，希望老了躺在床上不會後悔自己什麼都沒做。

螃蟹_crab的沙龍的其他內容

2025/04/01

[Python][OpenCV]斷字檢測：基於文字端點距離的檢測方法

1. 概述在光學字符識別（OCR）過程中，常見的問題之一是「斷字」，即原本應為一個完整字符的部分被錯誤地分割成兩個或多個獨立的字符。這通常發生在掃描文件、圖像降噪或影像二值化處理後。本篇文章將介紹一種基於骨架化端點距離分析的斷字檢測方法，並提供完整的 Python 實作。 2. 斷字檢測的

2025/04/01

[Python][OpenCV]斷字檢測：基於文字端點距離的檢測方法

2025/03/13

[Python][OpenCV]螺絲鎖附間距檢測

本教學將介紹如何使用 OpenCV 來檢測螺絲的鎖附間距，並提供完整的 Python 程式碼來實作這項功能。 🔹 1. 設計目標使用二值化處理與形態學運算來強化影像計算螺絲之間的間距視覺化結果，標記最大間距並顯示數值 🔹 2. 測試用螺絲影像 🔹 3.

2025/03/13

[Python][OpenCV]螺絲鎖附間距檢測

2025/01/18

[OpneCV][Python]通過 KMeans 聚類演算法分析圖像(HSV色彩空間)

我們將學習如何使用 Python 和 OpenCV 實現圖像的主色提取與重新著色。以下的程式碼展示了如何通過 KMeans 聚類演算法分析圖像，提取 HSV 色彩空間中的主色，並將圖像重新著色，提取想偵測的物件的顏色。在官網案例，實作為RGB色彩空間，但如果套用HSV色彩空間則會因為H色

2025/01/18

[OpneCV][Python]通過 KMeans 聚類演算法分析圖像(HSV色彩空間)

看更多

你可能也想看

k.S的量化投資

【深度解讀】打破百萬門檻迷思：小資族如何透過「債券孳息」打造優於定存的美元現金流？

債券投資，不只是高資產族群的遊戲在傳統的投資觀念中，海外債券（Overseas Bonds）常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻，讓許多想尋求穩定配息的小資族望而卻步。然而，在股市波動劇烈的環境下，尋求穩定的美元現金流與被動收入成為許多投資人

#玉山證券#海外債券#債券孳息

2026/02/06

k.S的量化投資

【深度解讀】打破百萬門檻迷思：小資族如何透過「債券孳息」打造優於定存的美元現金流？

#玉山證券#海外債券#債券孳息

2026/02/06

Jorge2006的沙龍

玉山證券小額債—川普又來報明牌啦!

透過川普的近期債券交易揭露，探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響，以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺，如何讓小資族也能低門檻參與海外債券市場，實現「低門檻、低波動、固定收益」的務實投資方式。

2026/03/13

2026/03/13

拒絕梭哈投資，建立財務餘裕｜玉山證券小額債為你打造資產穩定錨

解析「債券」如何成為資產配置中的穩定錨，提供低風險高回報的投資選項。藉由玉山證券的低門檻債券服務，投資者可輕鬆入手，平衡風險並穩定財務。

#投資#資產配置#債券投資

2026/03/13

CK On Board

拒絕梭哈投資，建立財務餘裕｜玉山證券小額債為你打造資產穩定錨

#投資#資產配置#債券投資

2026/03/13

小芝女看天下

任何人都能投資！用玉山證券小額債替自己存旅費：1,000 美元就能開始的穩健理財法

相較於波動較大的股票，債券能提供固定現金流，而玉山證券推出的小額債，更以1000 美元的低門檻，讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色，大幅降低投資難度，對於希望分散風險、建立穩定現金流的人來說，玉山小額債是一個值得嘗試的理財起點。

#玉山小額債#小額債#玉山證券

2026/02/12