影像辨識流程介紹

螃蟹_crab

發佈於[Python][OpenCV]學習心得筆記

更新於 2024/04/25發佈於 2024/04/19閱讀時間約 2 分鐘

針對辨識物的不同，流程就會不一樣，在依照現實狀況進行刪減，以下說明為個人常用的流程。

基本流程：

讀圖
灰階
濾波 (看圖片雜訊多不多)
二值化
連通區域
特徵篩選
特徵資訊
辨識 - (OCR，量測，瑕疵檢測等。)

簡單流程表示

名詞介紹

Gray 灰階

將原始的彩色圖像轉換為灰階圖像。這樣做的目的是為了將圖像中的彩色信息轉換為單一的亮度值，方便後續的處理。

Filtering 濾波

濾波是一個用於去除圖像中噪聲的過程。通過應用不同類型的濾波器，可以平滑圖像、增強邊緣或者去除不需要的細節，從而改善後續處理的效果。

Thresholding 二值化

是一種常見的影像處理技術，其目的是將灰度影像轉換為只有兩個值的黑白影像。這兩個值通常表示為0和255，或者0和1。

在二值化過程中，我們設定一個閾值，用來判斷每個像素的灰度值。

如果像素的灰度值大於閾值，則將其設為一個值（如255或1），表示白色；

如果像素的灰度值小於等於閾值，則將其設為另一個值（如0），表示黑色。

Connected Components 連通區域

是一種在影像處理中常用的技術，用於尋找並標識影像中連通的區域。當我們在影像中有許多區域需要識別和分割時，連通區域的概念就變得很重要。

具體來說，Connected Components 演算法會將一幅影像分割成許多連通的區域，這些區域通常是指像素彼此相鄰且具有相同性質（如顏色、亮度等）的區域。這些區域可以是圖像中的物體、背景或其他特定的區域。

在影像處理中，我們常常使用 Connected Components 來執行物體檢測、分割和識別等任務。例如，在機器視覺中，我們可以使用 Connected Components 來找出影像中的各個物體，並對它們進行進一步的處理和分析。

Feature Selection 特徵篩選

在這個步驟中，從圖像中提取出來的特徵進行篩選，選擇出最具代表性和信息量的特徵。這些特徵可以是圖像中的邊緣、角點、紋理等，通常用於後續的物體識別或分類。

Feature Information 特徵資訊

這一步是將從圖像中提取的特徵轉換為可供機器學習算法理解的數據格式。這些特徵資訊通常被用於訓練機器學習模型，從而實現圖像識別、量測、瑕疵檢測等應用。

Recognition 辨識

利用機器學習模型或其他演算法來識別圖像中的物體、文字或其他感興趣的目標。

光學字符識別（OCR）、對象偵測、量測、瑕疵檢測等任務，具體取決於應用的需求和目標。

#影像辨識

#影像辨識流程介紹

螃蟹_crab的沙龍[Python][OpenCV]學習心得筆記OpenCV影像基礎操作

留言

留言分享你的想法！

螃蟹_crab的沙龍

149會員

284內容數

本業是影像辨識軟體開發，閒暇時間進修AI相關內容，將學習到的內容寫成文章分享。興趣是攝影，踏青，探索未知領域。人生就是不斷的挑戰及自我認清，希望老了躺在床上不會後悔自己什麼都沒做。

螃蟹_crab的沙龍的其他內容

2025/02/15

[Python]OpenCV 輪廓逼近技術教學：使用 cv2.arcLength 與 cv2.approxPolyDP

在電腦視覺應用中，輪廓（Contour）常用來描述物體的邊界。當圖像中有雜訊或物體邊緣過於複雜時，我們可以利用輪廓逼近技術，將輪廓簡化成較少點數的多邊形，這不僅有助於後續的形狀分析，也能提高處理速度。本文將介紹如何使用 OpenCV 中的 cv2.arcLength 與 cv2.approx

2025/02/15

[Python]OpenCV 輪廓逼近技術教學：使用 cv2.arcLength 與 cv2.approxPolyDP

2024/12/02

[Python][OpenCV]自適應中值濾波

中值濾波器（Adaptive Median Filter）是一種針對噪聲去除的圖像處理技術，主要應用於處理含有椒鹽雜訊的圖像，但在椒鹽雜訊過大時就會面臨，若為了處理掉雜訊，使用的處理窗口(kernel)就要大一點，會造成圖像的邊緣模糊掉。後面為解決這個問題，就發展了自適應中值濾波器，其概念源自於

2024/12/02

[Python][OpenCV]自適應中值濾波

2024/10/03

[OpenCV][Python]形態學結構元素在影像處理中的應用

在影像處理中，形態學操作是非常重要的一種技術，能夠幫助我們去除噪點、強化特徵、修復物體的形狀等。形態學操作的核心是「結構元素」（kernel），不同形狀的結構元素會產生不同的處理效果。本文將介紹如何使用不同形狀的結構元素來進行圖像處理，並結合實際程式範例和測試圖片來說明其效果。

2024/10/03

[OpenCV][Python]形態學結構元素在影像處理中的應用

看更多

你可能也想看

小愛和彤彤的小日常的沙龍

告別瞇眼寫功課！喜光TIONE⁺光健康智慧檯燈守護孩子視力

孩子寫功課時瞇眼？小心近視！這款喜光全光譜TIONE⁺光健康智慧檯燈，獲眼科院長推薦，網路好評不斷！全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉，讓孩子學習更舒適、保護眼睛！

#方格新手#保護眼睛#閱讀

2025/06/21

小愛和彤彤的小日常的沙龍

告別瞇眼寫功課！喜光TIONE⁺光健康智慧檯燈守護孩子視力

#方格新手#保護眼睛#閱讀

2025/06/21

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

創作者營運專員/經理（Operations Specialist/Manager）將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力，找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。

#vocus#方格子#求職

2025/06/23

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

#vocus#方格子#求職

2025/06/23

螃蟹_crab的沙龍

[OpenCV][Python]印出圖像中文字的位置及高寬

本文將說明如何去辨識出圖片文字位置及高寬。

#文字的位置及高寬#OCR#OpenCV

2024/07/24

螃蟹_crab的沙龍

[OpenCV][Python]印出圖像中文字的位置及高寬

本文將說明如何去辨識出圖片文字位置及高寬。

#文字的位置及高寬#OCR#OpenCV

2024/07/24

螃蟹_crab的沙龍

[Python]使用NumPy 進行影像黑白反轉

在某些特殊情況下，需要將圖片進行黑白反轉，例如Tesseract(OCR辨識引擎)就有建議黑底白字的狀況下辨識率較高。本文將使用 NumPy 進行影像黑白反轉，並顯示反轉前後的影像。

#NumPy#Python#黑白影像反轉

2024/07/18

螃蟹_crab的沙龍

[Python]使用NumPy 進行影像黑白反轉

#NumPy#Python#黑白影像反轉

2024/07/18

螃蟹_crab的沙龍

[OpenCV][Python]利用K-means分群來做圖像色彩分析

在影像辨識中，若遇到物件與背景難以分辨的狀況下，先做一下色彩分析，知道了色彩強度階層上的像素數，有助於了解後續需要做什麼處理，比較好分割出辨識物。若想辨識的物件與背景的RGB值過於接近，也比較好說明此狀況，為什麼較難分割出物件。成果呈現第一張圖：左邊為原圖，右邊為分析結果的圖，用其他顏

#OpenCV#Python#圖像色彩分析

2024/07/13

螃蟹_crab的沙龍

[OpenCV][Python]利用K-means分群來做圖像色彩分析

#OpenCV#Python#圖像色彩分析

2024/07/13

leqi.ai

如何利用OCR技術提高PDF文檔處理效率

學習如何將掃描的PDF轉換為可搜索文本，並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。

#學習#學術#電子

2024/06/11

leqi.ai

如何利用OCR技術提高PDF文檔處理效率

學習如何將掃描的PDF轉換為可搜索文本，並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。

#學習#學術#電子

2024/06/11

leqi.ai

瞭解如何將掃描的PDF轉換為可搜索的文本

在本文中，我們將瞭解如何將掃描的PDF轉換為可搜索文本，並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。

#PDF#pdftopdf#OCR

2024/06/04

leqi.ai

瞭解如何將掃描的PDF轉換為可搜索的文本

在本文中，我們將瞭解如何將掃描的PDF轉換為可搜索文本，並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。

#PDF#pdftopdf#OCR

2024/06/04

螃蟹_crab的沙龍

影像辨識流程介紹

針對辨識物的不同，流程就會不一樣，在依照現實狀況進行刪減，以下說明為個人常用的流程。基本流程：讀圖灰階濾波 (看圖片雜訊多不多) 二值化連通區域特徵篩選特徵資訊辨識 - (OCR，量測，瑕疵檢測等。) 名詞介紹 Gray 灰階將原始的彩色圖像轉換為灰階圖

2024/04/19

2024/04/19

[OpenCV基礎][Python]影像的色彩空間轉換

涉及圖像處理和計算機視覺時，色彩空間轉換是一個常見操作，應用如下：降維：將一張彩色圖像轉換為灰度圖像可以減少數據的維度，簡化處理過程，同時在某些情況下保留重要的視覺信息。突顯特徵：在某些情況下，某些色彩通道可能包含冗餘或不必要的信息，通過轉換到其他色彩空間，可以更好地突顯圖像中的重要特徵

#OpenCV影像操作#OpenCV影像基礎#色彩空間轉換

2024/02/22

螃蟹_crab的沙龍

[OpenCV基礎][Python]影像的色彩空間轉換

#OpenCV影像操作#OpenCV影像基礎#色彩空間轉換

2024/02/22

阿Han的沙龍

【Python 軍火庫🧨 - EasyOCR】讓我們對圖片進行文字辨識吧

EasyOCR是一個能夠幫助你對圖片中的文字進行辨識的工具，透過進階分析，可以應用在文件掃描、自動化數據輸入、發票掃描等領域。本章節將介紹如何安裝、引用模型、進行文字辨識、以及辨識結果的分析。透過學習，你可以建立屬於自己的文字辨識系統。

#模型#GPU#文章

2024/02/20

阿Han的沙龍

【Python 軍火庫🧨 - EasyOCR】讓我們對圖片進行文字辨識吧

#模型#GPU#文章

2024/02/20

螃蟹_crab的沙龍

[OpenCV基礎][Python]影像操作(讀取、顯示、保存、裁剪、旋轉、縮放)

本文將介紹影像的基本操作包括：影像的讀取、顯示、保存，以及一些常見的操作如裁剪、旋轉、縮放等。語法介紹讀取影像： cv2.imread函數的參數是影像的檔案路徑。讀取後的影像以NumPy的ndarray形式表示。

#Python#OpenCV影像基礎#OpenCV影像操作

2024/01/29

螃蟹_crab的沙龍

[OpenCV基礎][Python]影像操作(讀取、顯示、保存、裁剪、旋轉、縮放)

#Python#OpenCV影像基礎#OpenCV影像操作

2024/01/29

螃蟹_crab的沙龍

[OCR_應用]Tesseract-OCR_擷取字元面積

使用Google Tesseract應用，擷取圖像的OCR並將讀取到的字元標註在原圖上光學字元辨識功能 (Optical character recognition，光學字符辨識）可以將影像中特徵範圍內的文本轉換為數字形式的文本。使用前必須安装Google Tesseract並更新

#OCR應用#Tesseract#OCR長寬面積

2024/01/06

螃蟹_crab的沙龍

[OCR_應用]Tesseract-OCR_擷取字元面積

#OCR應用#Tesseract#OCR長寬面積

2024/01/06

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News