1. 概述
在光學字符識別(OCR)過程中,常見的問題之一是「斷字」,即原本應為一個完整字符的部分被錯誤地分割成兩個或多個獨立的字符。這通常發生在掃描文件、圖像降噪或影像二值化處理後。本篇文章將介紹一種基於 骨架化端點距離分析 的斷字檢測方法,並提供完整的 Python 實作。
2. 斷字檢測的核心概念
2.1 什麼是端點(Endpoints)?
當對文字進行 骨架化(Skeletonization)處理後,字符的筆畫會被轉換成單像素寬度的線條。字符的端點是這些線條的末端,通常是筆畫的開始或結束處。

2.2 端點距離檢測
我們可以通過計算字符的端點之間的歐幾里得距離來檢測斷字現象。
- 如果端點間距過大,則可能是兩個獨立的字符。
- 如果端點距離適中(可調參數),則可能是被錯誤分割的字符。
