2024-02-04|閱讀時間 ‧ 約 23 分鐘

【🔒 影像辨識 - OpenCV系列】Ep.1 關於影像的基本單位

歡迎來到「阿Han的軟體心法實戰營 - 影像處理」系列的文章區,我們會針對影像處理的相關知識、開發技巧進行分享,並教你手把手用程式寫出屬於自己的影像處理程式, 當然也會包括AI模型訓練的部分,就讓我們一起來探索影像處理的領域吧!

在進入影像辨識的世界之前, 我們先來了解一下關於解析度的基本概念吧! 後續我們也會教您如何搭配OpenCV來進行影像相關的處理作業。


影像視覺

影像視覺主要目標是讓機器與人類一樣具有視覺能力的識別功能, 對人類來說眼睛看到影像, 透過大腦轉成可以理解的形式(球、建築…), 最後再透過語言轉達, 看似很自然, 但對電腦來說可一點都不簡單。


電腦本身沒有眼睛, 因此需要透過拍照、錄影…等方式, 將圖片的物件轉成機器可以理解的0 1 0 1, 理解之後就能夠透過規則來辨別出可能的物件。


影像處理

影像處理的目標就是讓圖片轉換成機器可以閱讀的資料格式, 因為輸入裝置會有各式各樣的設備, 手機、攝影機、雷達…都是輸入的設備, 而經過影像處理之後, 統一轉換成標準格式, 才能夠進行後續的計算, 包括放大、縮小、變形、去雜訊…, 都是為了讓後續的影像辨識更快更精準。


怎麼儲存在電腦中?

基本上最小單位就是所謂的「pixel」像素, 也就是一格一格的概念, 它可以帶有特定的色彩和亮度信息。



黑白 x 灰階 x 彩色的佔用容量

  • 黑白: 一個格子要嘛白、要嘛黑, 因此僅需要1個bits來儲存。
  • 灰階: 從純黑(00000000)到純白(11111111)之間會有2 ^ 8 = 256種組合, 因此每一格pixel會需要8bits(1 bytes)來儲存。
  • 彩色(RGB):由於彩色RGB是用紅、綠、藍三個通道組成, 而每一個通道佔用的是8bits*3=24bits=3bytes。

座標



所謂解析度

我們常常看到的「800 * 600」、「1024 * 768」是什麼意思呢? 通常是指圖像的像素數量。

以 800 * 600 為例, 就是x軸會有800格、而y軸會有600格組成的一張圖,因此解析度越高越清晰,因為格子的粗細度有所不同,但額外的也會增加空間的耗用。

結語

初步接觸影像辨識的過程, 基本的概念還是得建立才容易進入到實作階段, 因此我們試著對影像最基本的儲存開始了解起,之後對於影像辨識的運算會更加的清晰。


更多關於影像處理的知識歡迎來「🔒 阿Han的軟體心法實戰營 - 影像辨識」坐坐。

分享至
成為作者繼續創作的動力吧!
嗨! 大家好,我是阿Han,歡迎來到「🔒 阿Han的軟體心法實戰營」,這裡將會手把手帶你系統化的學習軟體開發技能,並透過實戰來加深學習成效,邊學邊做能夠讓您在職涯上一帆風順,成為獨當一面的技術專家。
從 Google News 追蹤更多 vocus 的最新精選內容從 Google News 追蹤更多 vocus 的最新精選內容

發表回應

成為會員 後即可發表留言