【🔒 影像辨識 - OpenCV系列】Ep.1 關於影像的基本單位

2024/02/04閱讀時間約 2 分鐘

歡迎來到「阿Han的軟體心法實戰營 - 影像處理」系列的文章區,我們會針對影像處理的相關知識、開發技巧進行分享,並教你手把手用程式寫出屬於自己的影像處理程式, 當然也會包括AI模型訓練的部分,就讓我們一起來探索影像處理的領域吧!

在進入影像辨識的世界之前, 我們先來了解一下關於解析度的基本概念吧! 後續我們也會教您如何搭配OpenCV來進行影像相關的處理作業。


影像視覺

影像視覺主要目標是讓機器與人類一樣具有視覺能力的識別功能, 對人類來說眼睛看到影像, 透過大腦轉成可以理解的形式(球、建築…), 最後再透過語言轉達, 看似很自然, 但對電腦來說可一點都不簡單。


電腦本身沒有眼睛, 因此需要透過拍照、錄影…等方式, 將圖片的物件轉成機器可以理解的0 1 0 1, 理解之後就能夠透過規則來辨別出可能的物件。


影像處理

影像處理的目標就是讓圖片轉換成機器可以閱讀的資料格式, 因為輸入裝置會有各式各樣的設備, 手機、攝影機、雷達…都是輸入的設備, 而經過影像處理之後, 統一轉換成標準格式, 才能夠進行後續的計算, 包括放大、縮小、變形、去雜訊…, 都是為了讓後續的影像辨識更快更精準。


怎麼儲存在電腦中?

基本上最小單位就是所謂的「pixel」像素, 也就是一格一格的概念, 它可以帶有特定的色彩和亮度信息。

raw-image



黑白 x 灰階 x 彩色的佔用容量

  • 黑白: 一個格子要嘛白、要嘛黑, 因此僅需要1個bits來儲存。
  • 灰階: 從純黑(00000000)到純白(11111111)之間會有2 ^ 8 = 256種組合, 因此每一格pixel會需要8bits(1 bytes)來儲存。
  • 彩色(RGB):由於彩色RGB是用紅、綠、藍三個通道組成, 而每一個通道佔用的是8bits*3=24bits=3bytes。

座標

raw-image



所謂解析度

我們常常看到的「800 * 600」、「1024 * 768」是什麼意思呢? 通常是指圖像的像素數量。

以 800 * 600 為例, 就是x軸會有800格、而y軸會有600格組成的一張圖,因此解析度越高越清晰,因為格子的粗細度有所不同,但額外的也會增加空間的耗用。

結語

初步接觸影像辨識的過程, 基本的概念還是得建立才容易進入到實作階段, 因此我們試著對影像最基本的儲存開始了解起,之後對於影像辨識的運算會更加的清晰。


更多關於影像處理的知識歡迎來「🔒 阿Han的軟體心法實戰營 - 影像辨識」坐坐。

91會員
260內容數
哈囉,我是阿Han,是一位 👩‍💻 軟體研發工程師,喜歡閱讀、學習、撰寫文章及教學,擅長以圖代文,化繁為簡,除了幫助自己釐清思路之外,也希望藉由圖解的方式幫助大家共同學習,甚至手把手帶您設計出高品質的軟體產品。
留言0
查看全部
發表第一個留言支持創作者!
從 Google News 追蹤更多 vocus 的最新精選內容