影像辨識流程介紹

更新於 2024/04/25閱讀時間約 2 分鐘

針對辨識物的不同,流程就會不一樣,在依照現實狀況進行刪減,以下說明為個人常用的流程。


基本流程:

  1. 讀圖
  2. 灰階
  3. 濾波 (看圖片雜訊多不多)
  4. 二值化
  5. 連通區域
  6. 特徵篩選
  7. 特徵資訊
  8. 辨識 - (OCR,量測,瑕疵檢測等。)
簡單流程表示

簡單流程表示


名詞介紹

Gray 灰階

將原始的彩色圖像轉換為灰階圖像。這樣做的目的是為了將圖像中的彩色信息轉換為單一的亮度值,方便後續的處理。

Filtering 濾波

濾波是一個用於去除圖像中噪聲的過程。通過應用不同類型的濾波器,可以平滑圖像增強邊緣或者去除不需要的細節,從而改善後續處理的效果。

Thresholding 二值化

是一種常見的影像處理技術,其目的是將灰度影像轉換為只有兩個值的黑白影像。這兩個值通常表示為0和255,或者0和1。

在二值化過程中,我們設定一個閾值,用來判斷每個像素的灰度值。

如果像素的灰度值大於閾值,則將其設為一個值(如255或1),表示白色;

如果像素的灰度值小於等於閾值,則將其設為另一個值(如0),表示黑色。

Connected Components 連通區域

是一種在影像處理中常用的技術,用於尋找並標識影像中連通的區域。當我們在影像中有許多區域需要識別分割時,連通區域的概念就變得很重要。

具體來說,Connected Components 演算法會將一幅影像分割成許多連通的區域,這些區域通常是指像素彼此相鄰且具有相同性質(如顏色、亮度等)的區域。這些區域可以是圖像中物體、背景其他特定的區域

在影像處理中,我們常常使用 Connected Components 來執行物體檢測、分割和識別等任務。例如,在機器視覺中,我們可以使用 Connected Components 來找出影像中的各個物體,並對它們進行進一步的處理和分析。

Feature Selection 特徵篩選

在這個步驟中,從圖像中提取出來的特徵進行篩選,選擇出最具代表性和信息量的特徵。這些特徵可以是圖像中的邊緣、角點、紋理等,通常用於後續的物體識別或分類。

Feature Information 特徵資訊

這一步是將從圖像中提取的特徵轉換為可供機器學習算法理解數據格式。這些特徵資訊通常被用於訓練機器學習模型,從而實現圖像識別、量測、瑕疵檢測等應用。

Recognition 辨識

利用機器學習模型其他演算法識別圖像中物體文字其他感興趣的目標。

光學字符識別(OCR)、對象偵測、量測、瑕疵檢測等任務,具體取決於應用的需求和目標。


avatar-img
128會員
209內容數
本業是影像辨識軟體開發,閒暇時間進修AI相關內容,將學習到的內容寫成文章分享。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
螃蟹_crab的沙龍 的其他內容
伽瑪校正(Gamma correction)被視為影像增強的一種方法之一。 通過調整 gamma 值,可以改變圖像的亮度和對比度,從而使圖像更清晰或更具有視覺效果。 以下將利用cv2.LUT及numpy的組合實現伽瑪校正,及詳細介紹cv2.LUT 函式應用。
介紹OpenCV中的cv2.matchTemplate和cv2.minMaxLoc函數的使用方法和參數,提供程式範例以及相關特徵匹配的詳細介紹,讓讀者對此有更深入的瞭解。
[OpenCV應用][Python]找出圖像中的四個方位的邊緣點求出寬高 呈上篇應用Numpy找到的座標點,那我們如何捨棄掉差異過大的座標點呢? 可能圖像物件邊緣不佳,採樣就會差異過大,造成計算出的寬高是不準確的。 遇到這種狀況,就可以使用下方的程式範例來篩選座標點。 為求方便,此範例跟圖
使用反三角函數鐘的反正切函數 math.atan2() 計算出兩個座標之間的角度。 實現方法 邊界的最大最小值,相減求得對邊,鄰邊由檢測ROI的寬或高,求得角度 定義旋轉方向性,由邊界最大最小值的座標位子得知,旋轉方向性 程式範例 利用圖中白色物體的上邊界兩個座標點位,算出物體旋轉角度。
觀看本文將可以學習到如何利用Numpy求得物件的邊緣點,及算出物件的寬跟高。 有詳細的程式邏輯說明,及各函式用法說明。 綠點及紅點則是採樣到的邊界點,比較粗的點是偵測到的最大值 完整程式碼 import cv2 import numpy as np import matplotl
瞭解二值化影像的應用和程式語法,包括物體檢測和分割、邊緣檢測、圖像分析和測量、文檔辨識,以及使用cv2.threshold的參數和程式範例。
伽瑪校正(Gamma correction)被視為影像增強的一種方法之一。 通過調整 gamma 值,可以改變圖像的亮度和對比度,從而使圖像更清晰或更具有視覺效果。 以下將利用cv2.LUT及numpy的組合實現伽瑪校正,及詳細介紹cv2.LUT 函式應用。
介紹OpenCV中的cv2.matchTemplate和cv2.minMaxLoc函數的使用方法和參數,提供程式範例以及相關特徵匹配的詳細介紹,讓讀者對此有更深入的瞭解。
[OpenCV應用][Python]找出圖像中的四個方位的邊緣點求出寬高 呈上篇應用Numpy找到的座標點,那我們如何捨棄掉差異過大的座標點呢? 可能圖像物件邊緣不佳,採樣就會差異過大,造成計算出的寬高是不準確的。 遇到這種狀況,就可以使用下方的程式範例來篩選座標點。 為求方便,此範例跟圖
使用反三角函數鐘的反正切函數 math.atan2() 計算出兩個座標之間的角度。 實現方法 邊界的最大最小值,相減求得對邊,鄰邊由檢測ROI的寬或高,求得角度 定義旋轉方向性,由邊界最大最小值的座標位子得知,旋轉方向性 程式範例 利用圖中白色物體的上邊界兩個座標點位,算出物體旋轉角度。
觀看本文將可以學習到如何利用Numpy求得物件的邊緣點,及算出物件的寬跟高。 有詳細的程式邏輯說明,及各函式用法說明。 綠點及紅點則是採樣到的邊界點,比較粗的點是偵測到的最大值 完整程式碼 import cv2 import numpy as np import matplotl
瞭解二值化影像的應用和程式語法,包括物體檢測和分割、邊緣檢測、圖像分析和測量、文檔辨識,以及使用cv2.threshold的參數和程式範例。
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
點陣圖 點陣圖是由許多方格像素組成的圖片, 因此我們常常在將圖片放大時會呈現像是馬賽克的狀況, 假設期望圖片越清晰那所需要的像素會較多個, 因此空間耗用量也相對較大。 常見的格式有: .JPG .PNG .GIF .BMP .TIFF等格式。 繪製程式碼: 向量圖 向量
Thumbnail
繼上次分享的「【🔒 影像辨識 - 影像處理】Ep.1 關於影像的基本單位, 相信我們對於影像的儲存應該有了基本的認識了, 那麼接下來我們會需要的是了解顏色的組成。 我們除了在文章裡講述概念之外, 也會提供實作的數位作品分享給大家, 請大家根據範例學習與練習。 關於顏色 灰階的時代 早期尚未
Thumbnail
歡迎來到「阿Han的軟體心法實戰營 - 影像處理」系列的文章區,我們會針對影像處理的相關知識、開發技巧進行分享,並教你手把手用程式寫出屬於自己的影像處理程式, 當然也會包括AI模型訓練的部分,就讓我們一起來探索影像處理的領域吧! 在進入影像辨識的世界之前, 我們先來了解一下關於解析度的基本概念吧!
Thumbnail
不管你是創作者和學習者,都應該試試看用語音辨識來協助你學得更好與做得更多! 你需要的工具有 手機上能語音辨識的軟體 (我推薦DayOne) 一部想要深入學習的影片 (看看自己今天想學什麼) 一個計時器(我都用iPhone內建的計時器) 接下來跟著這3個步驟! 步驟1 - 高效率觀看影片,就是看3分鐘
Thumbnail
這個篇章主要是讓我們能夠熟悉Whisper的安裝與使用方式,並簡單的對Youtube影片進行線上翻譯的工作,主軸在於了解一下整個Whisper使用方式到底是簡單還是複雜,就讓我們一起來玩玩看吧! 在這之前我們還是說一下Whisper它是什麼樣的一個工具,能夠做什麼? Whisper 是OpenAI
Thumbnail
要怎麼用CNN來便是智能合約的漏洞呢?上回介紹了能認知文章脈絡的RNN,這是介紹結合word embedding的方法,加上強大的CNN分類器可以讓自然語言分類處理擦出怎麼樣的火花~
Thumbnail
最近因為眼睛出了問題,再加上政策提案等等大事件交雜而停更了好一陣子。這篇會提到的漫畫跟遊戲作品幾部:咒術迴戰、進擊的巨人、鬼滅之刃、怪獸8號、巫師(狩魔人)
Thumbnail
你覺得你做了很多,卻沒有人感謝你! 你覺得你付出了一切,卻遭到不領情、曲解、甚至是拒絕! 到底為什麼好心沒好報呢?做甚麼都吃力不討好呢? 你也曾懷有救世主情節,時常變身成拯救英雄為身邊的人救火嗎?很抱歉~造成今天這個局面,是因為你自以為的犧牲。如何擺脫一定要變身成拯救英雄的角色設定呢?
Thumbnail
文/黃倩茹 攝/陳睿珮   Viscovery 創意引晴專長「影音大數據分析」,Viscovery執行長黃俊傑表示,就是透過人工智慧自動分析影音資料,辨識有價值的物件,有助於分析非結構性的內容。比方說一部兩個小時的影片,可以透過Viscovery 的自動分析,知道影片的內容為何,應用在商業行銷模式
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
點陣圖 點陣圖是由許多方格像素組成的圖片, 因此我們常常在將圖片放大時會呈現像是馬賽克的狀況, 假設期望圖片越清晰那所需要的像素會較多個, 因此空間耗用量也相對較大。 常見的格式有: .JPG .PNG .GIF .BMP .TIFF等格式。 繪製程式碼: 向量圖 向量
Thumbnail
繼上次分享的「【🔒 影像辨識 - 影像處理】Ep.1 關於影像的基本單位, 相信我們對於影像的儲存應該有了基本的認識了, 那麼接下來我們會需要的是了解顏色的組成。 我們除了在文章裡講述概念之外, 也會提供實作的數位作品分享給大家, 請大家根據範例學習與練習。 關於顏色 灰階的時代 早期尚未
Thumbnail
歡迎來到「阿Han的軟體心法實戰營 - 影像處理」系列的文章區,我們會針對影像處理的相關知識、開發技巧進行分享,並教你手把手用程式寫出屬於自己的影像處理程式, 當然也會包括AI模型訓練的部分,就讓我們一起來探索影像處理的領域吧! 在進入影像辨識的世界之前, 我們先來了解一下關於解析度的基本概念吧!
Thumbnail
不管你是創作者和學習者,都應該試試看用語音辨識來協助你學得更好與做得更多! 你需要的工具有 手機上能語音辨識的軟體 (我推薦DayOne) 一部想要深入學習的影片 (看看自己今天想學什麼) 一個計時器(我都用iPhone內建的計時器) 接下來跟著這3個步驟! 步驟1 - 高效率觀看影片,就是看3分鐘
Thumbnail
這個篇章主要是讓我們能夠熟悉Whisper的安裝與使用方式,並簡單的對Youtube影片進行線上翻譯的工作,主軸在於了解一下整個Whisper使用方式到底是簡單還是複雜,就讓我們一起來玩玩看吧! 在這之前我們還是說一下Whisper它是什麼樣的一個工具,能夠做什麼? Whisper 是OpenAI
Thumbnail
要怎麼用CNN來便是智能合約的漏洞呢?上回介紹了能認知文章脈絡的RNN,這是介紹結合word embedding的方法,加上強大的CNN分類器可以讓自然語言分類處理擦出怎麼樣的火花~
Thumbnail
最近因為眼睛出了問題,再加上政策提案等等大事件交雜而停更了好一陣子。這篇會提到的漫畫跟遊戲作品幾部:咒術迴戰、進擊的巨人、鬼滅之刃、怪獸8號、巫師(狩魔人)
Thumbnail
你覺得你做了很多,卻沒有人感謝你! 你覺得你付出了一切,卻遭到不領情、曲解、甚至是拒絕! 到底為什麼好心沒好報呢?做甚麼都吃力不討好呢? 你也曾懷有救世主情節,時常變身成拯救英雄為身邊的人救火嗎?很抱歉~造成今天這個局面,是因為你自以為的犧牲。如何擺脫一定要變身成拯救英雄的角色設定呢?
Thumbnail
文/黃倩茹 攝/陳睿珮   Viscovery 創意引晴專長「影音大數據分析」,Viscovery執行長黃俊傑表示,就是透過人工智慧自動分析影音資料,辨識有價值的物件,有助於分析非結構性的內容。比方說一部兩個小時的影片,可以透過Viscovery 的自動分析,知道影片的內容為何,應用在商業行銷模式