歡迎來到「阿Han的軟體心法實戰營 - 影像處理」系列的文章區,我們會針對影像處理的相關知識、開發技巧進行分享,並教你手把手用程式寫出屬於自己的影像處理程式, 當然也會包括AI模型訓練的部分,就讓我們一起來探索影像處理的領域吧!
在進入影像辨識的世界之前, 我們先來了解一下關於解析度的基本概念吧! 後續我們也會教您如何搭配OpenCV來進行影像相關的處理作業。
影像視覺主要目標是讓機器與人類一樣具有視覺能力的識別功能, 對人類來說眼睛看到影像, 透過大腦轉成可以理解的形式(球、建築…), 最後再透過語言轉達, 看似很自然, 但對電腦來說可一點都不簡單。
電腦本身沒有眼睛, 因此需要透過拍照、錄影…等方式, 將圖片的物件轉成機器可以理解的0 1 0 1, 理解之後就能夠透過規則來辨別出可能的物件。
影像處理的目標就是讓圖片轉換成機器可以閱讀的資料格式, 因為輸入裝置會有各式各樣的設備, 手機、攝影機、雷達…都是輸入的設備, 而經過影像處理之後, 統一轉換成標準格式, 才能夠進行後續的計算, 包括放大、縮小、變形、去雜訊…, 都是為了讓後續的影像辨識更快更精準。
基本上最小單位就是所謂的「pixel」像素, 也就是一格一格的概念, 它可以帶有特定的色彩和亮度信息。
我們常常看到的「800 * 600」、「1024 * 768」是什麼意思呢? 通常是指圖像的像素數量。
以 800 * 600 為例, 就是x軸會有800格、而y軸會有600格組成的一張圖,因此解析度越高越清晰,因為格子的粗細度有所不同,但額外的也會增加空間的耗用。
初步接觸影像辨識的過程, 基本的概念還是得建立才容易進入到實作階段, 因此我們試著對影像最基本的儲存開始了解起,之後對於影像辨識的運算會更加的清晰。
更多關於影像處理的知識歡迎來「🔒 阿Han的軟體心法實戰營 - 影像辨識」坐坐。