[OpenCV][Python]印出圖像中OCR面積及位置

發佈於[Python][OpenCV]學習心得筆記

更新於 2024/08/20發佈於 2024/08/20閱讀時間約 3 分鐘

本文延續上兩篇文章，新增印出圖像中OCR的面積及位置，與驗證連通域分析計算的面積是否正確，利用cv2.countNonZero來計算區域內非零的元素，因圖像OCR在連通域分析前就需轉換成黑底白字，剛好可利用此函數來計算面積。

[OpenCV][Python]印出圖像中文字的位置及高寬

結果圖

結果圖

結果圖

程式碼

import cv2
import numpy as np

def read_posion(img):
    '''
    輸入背景黑色，物件白色的圖
    '''
    num_labels, labels, stats, _ = cv2.connectedComponentsWithStats(img, connectivity=8)
    components = []
    # boxes_data = []
    for i in range(1, num_labels): # 跳過背景
        x, y, w, h, area = stats[i]
        if area >100:
            components.append((x, y, w, h,area))
    return components
    
img = cv2.imread(f'F:/python/opencv/chars_training_01.png')
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# Otsu's 方法進行自動二值化
_, binary_image = cv2.threshold(gray_img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
# 需讓OCR轉換成白色字體才能用連通域分析
binary_image = 255 - binary_image
box = read_posion(binary_image)

# 設置文字的相關屬性
font = cv2.FONT_HERSHEY_SIMPLEX  # 字體類型
font_scale = 0.5  # 字體大小
color = (0, 0, 0)  # 文字顏色 (B, G, R)，這裡是黑色
thickness = 1  # 文字粗細

for i,data in enumerate(box):
    x,y,w,h,area = data
    #印出OCR 位置，高寬
    print(f'第{i}個OCR，x:{x},y:{y},h:{h},w:{w},area:{area}')
    cv2.rectangle(img,(x,y), (x+w,y+h), (0,0,255), 1)
    area_1 = cv2.countNonZero(binary_image[y:y+h,x:x+w]) # 擷取與OCR一樣的位置計算白色面積
    print(f'第{i}個OCR_test，x:{x},y:{y},h:{h},w:{w},area:{area_1}')
    # 在圖像上繪製數字
    cv2.putText(img, str(area_1), (x - 10, y - 10), font, font_scale, color, thickness)

# 顯示結果圖像
cv2.imshow('reuslt', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

印出來的結果

兩者計算結果幾乎一模一樣，只有略差1~2pixl，可以忽略不計。

raw-image

#印出OCR位置

#印出OCR面積

螃蟹_crab的沙龍[Python][OpenCV]學習心得筆記OpenCV應用

螃蟹_crab的沙龍

134會員

222內容數

本業是影像辨識軟體開發，閒暇時間進修AI相關內容，將學習到的內容寫成文章分享。

留言2

留言分享你的想法！

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌
‌

‌
‌

‌

‌
‌

‌

‌
‌

螃蟹_crab的沙龍的其他內容

[Python]幾種去除字串中的空白字元的方法

在 Python 中，可以使用多種方法來去除字串中的空白字元，以下是幾種常見的方法：固定位置型使用 strip() 方法 strip() 方法會去除字串前後的空白字元（包括空格、換行、製表符號等）。

#Python #去除字串中的空白字元 #去除空白字元

[Python]代替Re正則表達式來處理String 字串的簡單方法

有別於正則表達式符號的難以理解，有其他簡單的方式也可以來處理字串的問題。本文主要介紹其他方法用於處理字串，尋找字串中的關鍵字與其他操作。 [Python]Re正則表達式中常用符號的重點整理字串方法（String Methods） Python 提供了多種內建的字串方法，可以替代某些簡單

#字串方法 #正則表達式 #代替Re正則表達式

[Python]Re正則表達式一些實用範例

紀錄一些，實用的re正則表達式需要用時，就可以直接複製貼上。檢查是否有中文字

#re正則表達式實用範例

[Python]Re正則表達式中常用符號的重點整理

當使用正則表達式（Regular Expressions, Regex）時，不同的符號和構造具有特定的含義，這些符號和模式可以用來構建靈活且強大的文本匹配規則。以下是正則表達式中常用符號的重點整理：字元類別 (Character Classes) [abc]: 匹配 a、b 或 c 中

#正則表達式 #正則表達式中常用符號

[OpenCV][Python]局部二值化（Local Thresholding）

局部二值化（Local Thresholding）是一種影像處理技術，用來根據局部區域的像素值動態地將影像轉換為二值影像。這在處理光照不均勻的影像時特別有用。與常見的兩種二值化(Otsu's與固定閥值)方法做比較。實現局部二值化的範例： import cv2 import numpy

#LocalThresholding #局部二值化 #處理光照不均勻

[Python]re 正則表達式基本介紹

re 模組基本介紹 re 模組是 Python 用來處理正則表達式的標準模組。正則表達式是一種用於描述字串模式的語法，可以用來匹配、搜尋、分割和替換字串中的特定模式。

#re正則表達式 #Python #regular

[Python]幾種去除字串中的空白字元的方法

在 Python 中，可以使用多種方法來去除字串中的空白字元，以下是幾種常見的方法：固定位置型使用 strip() 方法 strip() 方法會去除字串前後的空白字元（包括空格、換行、製表符號等）。

#Python #去除字串中的空白字元 #去除空白字元

[Python]代替Re正則表達式來處理String 字串的簡單方法

有別於正則表達式符號的難以理解，有其他簡單的方式也可以來處理字串的問題。本文主要介紹其他方法用於處理字串，尋找字串中的關鍵字與其他操作。 [Python]Re正則表達式中常用符號的重點整理字串方法（String Methods） Python 提供了多種內建的字串方法，可以替代某些簡單

#字串方法 #正則表達式 #代替Re正則表達式

[Python]Re正則表達式一些實用範例

紀錄一些，實用的re正則表達式需要用時，就可以直接複製貼上。檢查是否有中文字

#re正則表達式實用範例

[Python]Re正則表達式中常用符號的重點整理

當使用正則表達式（Regular Expressions, Regex）時，不同的符號和構造具有特定的含義，這些符號和模式可以用來構建靈活且強大的文本匹配規則。以下是正則表達式中常用符號的重點整理：字元類別 (Character Classes) [abc]: 匹配 a、b 或 c 中

#正則表達式 #正則表達式中常用符號

[OpenCV][Python]局部二值化（Local Thresholding）

局部二值化（Local Thresholding）是一種影像處理技術，用來根據局部區域的像素值動態地將影像轉換為二值影像。這在處理光照不均勻的影像時特別有用。與常見的兩種二值化(Otsu's與固定閥值)方法做比較。實現局部二值化的範例： import cv2 import numpy

#LocalThresholding #局部二值化 #處理光照不均勻

[Python]re 正則表達式基本介紹

re 模組基本介紹 re 模組是 Python 用來處理正則表達式的標準模組。正則表達式是一種用於描述字串模式的語法，可以用來匹配、搜尋、分割和替換字串中的特定模式。

#re正則表達式 #Python #regular

你可能也想看

Google News 追蹤

螃蟹_crab的沙龍

[OpenCV][Python]OCR辨識影像前處理_增加邊框

在tesseract-ocr辨識應用中，建議的留白邊框為10pixl，若Label列印的太剛好，沒有任何的邊框時，就會辨識不到文字。本文將帶大家如何讓圖像增加邊框。結果圖示意的比較誇張，我讓邊框增加100pixl，圖片大小原為211*80。

#OpenCV #Python #OCR辨識影像前處理

螃蟹_crab的沙龍

[OpenCV][Python]OCR分割及增加間隔[雙排文字]

呈上篇文章，針對單排的圖像文字增加間隔，但如果文字是雙排呢 [OpenCV][Python]OCR分割及增加間隔[單排文字]

#OCR分割及增加間隔 #OCR分割 #圖像文字增加間隔

螃蟹_crab的沙龍

[OpenCV][Python]印出圖像中文字的位置及高寬

本文將說明如何去辨識出圖片文字位置及高寬。

#文字的位置及高寬 #OCR #OpenCV

螃蟹_crab的沙龍

[OpenCV][Python]OCR分割及增加間隔[單排文字]

在文字辨識中，適當的增加一文字彼此間的間隔是有幫助於辨識的，原因在大多數OCR引擎在處理字符時會依賴空白區域來區分不同的字符。如果字符之間的間隔過小，OCR引擎可能會將相鄰的字符誤認為一個單一的字符或難以正確切割字符。增加間隔可以幫助OCR引擎更準確地識別和切割每個字符。本文說明如何增加OCR間

#OCR分割 #OCR增加間隔 #OpenCV

螃蟹_crab的沙龍

[Python][OpenCV]防止擷取圖像時超過範圍報錯

在影像處理中，有時候我們只想特別關注某個感興趣的區域時，就是ROI的概念，擷取此範圍的圖像來做處理。設定超過圖像邊界時就會報錯，本文主要介紹如何擷取影像的同時，避免設定錯誤造成程式崩潰的狀況。擷取圖像示意圖 ROI程式範例 import cv2 import numpy as np

#Python #OpenCV #ROI

螃蟹_crab的沙龍

[OpenCV][Python]利用K-means分群來做圖像色彩分析

在影像辨識中，若遇到物件與背景難以分辨的狀況下，先做一下色彩分析，知道了色彩強度階層上的像素數，有助於了解後續需要做什麼處理，比較好分割出辨識物。若想辨識的物件與背景的RGB值過於接近，也比較好說明此狀況，為什麼較難分割出物件。成果呈現第一張圖：左邊為原圖，右邊為分析結果的圖，用其他顏

#OpenCV #Python #圖像色彩分析

如何利用OCR技術提高PDF文檔處理效率

學習如何將掃描的PDF轉換為可搜索文本，並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。

#學習 #學術 #電子

螃蟹_crab的沙龍

[OpenCV應用][Python]利用numpy找出物件邊緣求出寬度及高度

大部分在求物件的寬度及高度，都會想到用OpenCV的findContours函式來做，從找到的輪廓中來計算物件的面積，周長，邊界框等屬性，從而得到物體的寬度與高度 [OpenCV應用][Python]利用findContours找出物件邊界框求出寬度及高度本文將用不同的方法，利用Numpy

#Python #opencv #OpenCV應用

螃蟹_crab的沙龍

[OpenCV應用][Python]利用findContours找出物件邊界框求出寬度及高度

本文將利用OpenCV的findContours函式，從找到的輪廓中來計算物件的面積，周長，邊界框等屬性，從而得到物體的寬度與高度。一般來說，我們在進行輪廓檢測時，會先進行圖像二值化，將對象轉換為白色，背景為黑色。這樣，在找到輪廓後，輪廓的點就會以白色表示，背景為黑色。結果圖從圖中綠色框

#OpenCV應用 #Python #python程式設計

螃蟹_crab的沙龍

[OCR_應用]Tesseract-OCR_擷取字元面積

使用Google Tesseract應用，擷取圖像的OCR並將讀取到的字元標註在原圖上光學字元辨識功能 (Optical character recognition，光學字符辨識）可以將影像中特徵範圍內的文本轉換為數字形式的文本。使用前必須安装Google Tesseract並更新

#OCR應用 #Tesseract #OCR長寬面積

螃蟹_crab的沙龍

[OpenCV][Python]OCR辨識影像前處理_增加邊框

在tesseract-ocr辨識應用中，建議的留白邊框為10pixl，若Label列印的太剛好，沒有任何的邊框時，就會辨識不到文字。本文將帶大家如何讓圖像增加邊框。結果圖示意的比較誇張，我讓邊框增加100pixl，圖片大小原為211*80。

#OpenCV #Python #OCR辨識影像前處理

螃蟹_crab的沙龍

[OpenCV][Python]OCR分割及增加間隔[雙排文字]

呈上篇文章，針對單排的圖像文字增加間隔，但如果文字是雙排呢 [OpenCV][Python]OCR分割及增加間隔[單排文字]

#OCR分割及增加間隔 #OCR分割 #圖像文字增加間隔

螃蟹_crab的沙龍

[OpenCV][Python]印出圖像中文字的位置及高寬

本文將說明如何去辨識出圖片文字位置及高寬。

#文字的位置及高寬 #OCR #OpenCV

螃蟹_crab的沙龍

[OpenCV][Python]OCR分割及增加間隔[單排文字]

在文字辨識中，適當的增加一文字彼此間的間隔是有幫助於辨識的，原因在大多數OCR引擎在處理字符時會依賴空白區域來區分不同的字符。如果字符之間的間隔過小，OCR引擎可能會將相鄰的字符誤認為一個單一的字符或難以正確切割字符。增加間隔可以幫助OCR引擎更準確地識別和切割每個字符。本文說明如何增加OCR間

#OCR分割 #OCR增加間隔 #OpenCV

螃蟹_crab的沙龍

[Python][OpenCV]防止擷取圖像時超過範圍報錯

在影像處理中，有時候我們只想特別關注某個感興趣的區域時，就是ROI的概念，擷取此範圍的圖像來做處理。設定超過圖像邊界時就會報錯，本文主要介紹如何擷取影像的同時，避免設定錯誤造成程式崩潰的狀況。擷取圖像示意圖 ROI程式範例 import cv2 import numpy as np

#Python #OpenCV #ROI

螃蟹_crab的沙龍

[OpenCV][Python]利用K-means分群來做圖像色彩分析

在影像辨識中，若遇到物件與背景難以分辨的狀況下，先做一下色彩分析，知道了色彩強度階層上的像素數，有助於了解後續需要做什麼處理，比較好分割出辨識物。若想辨識的物件與背景的RGB值過於接近，也比較好說明此狀況，為什麼較難分割出物件。成果呈現第一張圖：左邊為原圖，右邊為分析結果的圖，用其他顏

#OpenCV #Python #圖像色彩分析

如何利用OCR技術提高PDF文檔處理效率

學習如何將掃描的PDF轉換為可搜索文本，並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。

#學習 #學術 #電子

螃蟹_crab的沙龍

[OpenCV應用][Python]利用numpy找出物件邊緣求出寬度及高度

大部分在求物件的寬度及高度，都會想到用OpenCV的findContours函式來做，從找到的輪廓中來計算物件的面積，周長，邊界框等屬性，從而得到物體的寬度與高度 [OpenCV應用][Python]利用findContours找出物件邊界框求出寬度及高度本文將用不同的方法，利用Numpy

#Python #opencv #OpenCV應用

螃蟹_crab的沙龍

[OpenCV應用][Python]利用findContours找出物件邊界框求出寬度及高度

本文將利用OpenCV的findContours函式，從找到的輪廓中來計算物件的面積，周長，邊界框等屬性，從而得到物體的寬度與高度。一般來說，我們在進行輪廓檢測時，會先進行圖像二值化，將對象轉換為白色，背景為黑色。這樣，在找到輪廓後，輪廓的點就會以白色表示，背景為黑色。結果圖從圖中綠色框

#OpenCV應用 #Python #python程式設計

螃蟹_crab的沙龍

[OCR_應用]Tesseract-OCR_擷取字元面積

使用Google Tesseract應用，擷取圖像的OCR並將讀取到的字元標註在原圖上光學字元辨識功能 (Optical character recognition，光學字符辨識）可以將影像中特徵範圍內的文本轉換為數字形式的文本。使用前必須安装Google Tesseract並更新

#OCR應用 #Tesseract #OCR長寬面積