【🔒 影像辨識 - OpenCV系列】Ep.1 關於影像的基本單位

更新於 發佈於 閱讀時間約 2 分鐘

歡迎來到「阿Han的軟體心法實戰營 - 影像處理」系列的文章區,我們會針對影像處理的相關知識、開發技巧進行分享,並教你手把手用程式寫出屬於自己的影像處理程式, 當然也會包括AI模型訓練的部分,就讓我們一起來探索影像處理的領域吧!

在進入影像辨識的世界之前, 我們先來了解一下關於解析度的基本概念吧! 後續我們也會教您如何搭配OpenCV來進行影像相關的處理作業。


影像視覺

影像視覺主要目標是讓機器與人類一樣具有視覺能力的識別功能, 對人類來說眼睛看到影像, 透過大腦轉成可以理解的形式(球、建築…), 最後再透過語言轉達, 看似很自然, 但對電腦來說可一點都不簡單。


電腦本身沒有眼睛, 因此需要透過拍照、錄影…等方式, 將圖片的物件轉成機器可以理解的0 1 0 1, 理解之後就能夠透過規則來辨別出可能的物件。


影像處理

影像處理的目標就是讓圖片轉換成機器可以閱讀的資料格式, 因為輸入裝置會有各式各樣的設備, 手機、攝影機、雷達…都是輸入的設備, 而經過影像處理之後, 統一轉換成標準格式, 才能夠進行後續的計算, 包括放大、縮小、變形、去雜訊…, 都是為了讓後續的影像辨識更快更精準。


怎麼儲存在電腦中?

基本上最小單位就是所謂的「pixel」像素, 也就是一格一格的概念, 它可以帶有特定的色彩和亮度信息。

raw-image



黑白 x 灰階 x 彩色的佔用容量

  • 黑白: 一個格子要嘛白、要嘛黑, 因此僅需要1個bits來儲存。
  • 灰階: 從純黑(00000000)到純白(11111111)之間會有2 ^ 8 = 256種組合, 因此每一格pixel會需要8bits(1 bytes)來儲存。
  • 彩色(RGB):由於彩色RGB是用紅、綠、藍三個通道組成, 而每一個通道佔用的是8bits*3=24bits=3bytes。

座標

raw-image



所謂解析度

我們常常看到的「800 * 600」、「1024 * 768」是什麼意思呢? 通常是指圖像的像素數量。

以 800 * 600 為例, 就是x軸會有800格、而y軸會有600格組成的一張圖,因此解析度越高越清晰,因為格子的粗細度有所不同,但額外的也會增加空間的耗用。

結語

初步接觸影像辨識的過程, 基本的概念還是得建立才容易進入到實作階段, 因此我們試著對影像最基本的儲存開始了解起,之後對於影像辨識的運算會更加的清晰。


更多關於影像處理的知識歡迎來「🔒 阿Han的軟體心法實戰營 - 影像辨識」坐坐。

avatar-img
120會員
270內容數
哈囉,我是阿Han,是一位 👩‍💻 軟體研發工程師,喜歡閱讀、學習、撰寫文章及教學,擅長以圖代文,化繁為簡,除了幫助自己釐清思路之外,也希望藉由圖解的方式幫助大家共同學習,甚至手把手帶您設計出高品質的軟體產品。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
在創作的路上真的很多人問我說 到底要怎麼做出符合自己期待 但又可以表現得很有美感的作品?🥹 這個問題真的應該是每個創作者都一直在學習的課題吧!
Thumbnail
API是我們與其他系統介接的標準化規格, 那一份好的規格勢必要能夠達到引導與驗證的作用, 避免對方介接錯誤, 引發後續的災難性損失, 因此這一章節就是要教我們如何定義每個API的欄位怎麼填? 資料型態是什麼? 以及如何生成API文件。 我們在「【🔒 Python API框架篇 - Fas
森林裡的小兔子琪琪有一本秘密日記,裡面記錄了她每天的心情、喜歡的事物,還有她的住址和最愛吃的胡蘿蔔品牌。這些資訊對她來說非常重要,她不希望被其他動物偷看,尤其是狡猾的狐狸。 一天,琪琪覺得寫日記太麻煩了,就決定把日記內容寫在森林大樹的公告板上,這樣以後想看時,只要回來翻閱就好了。她還告訴自己:「沒
Thumbnail
Frames per second簡稱FPS, 也就是每秒幾個幀數的意思, 平常我們看到的影片背後其實都是一張張圖片的組成, 而這一幅畫面就是影片的每一幀。 由於人眼的特殊生理結構, 畫面的幀數只要高於每秒10 - 12張的時候就會認為是連貫的, 這也就是為什麼電影膠片是一格格的拍攝出來, 但是藉
Thumbnail
點陣圖 點陣圖是由許多方格像素組成的圖片, 因此我們常常在將圖片放大時會呈現像是馬賽克的狀況, 假設期望圖片越清晰那所需要的像素會較多個, 因此空間耗用量也相對較大。 常見的格式有: .JPG .PNG .GIF .BMP .TIFF等格式。 繪製程式碼: 向量圖 向量
Thumbnail
繼上次分享的「【🔒 影像辨識 - 影像處理】Ep.1 關於影像的基本單位, 相信我們對於影像的儲存應該有了基本的認識了, 那麼接下來我們會需要的是了解顏色的組成。 我們除了在文章裡講述概念之外, 也會提供實作的數位作品分享給大家, 請大家根據範例學習與練習。 關於顏色 灰階的時代 早期尚未
Thumbnail
此篇為路線心得所以會有劇情雷,若只想看遊戲介紹及無雷心得請至https://vocus.cc/wow_gamereview/628209a9fd897800013930c3
Thumbnail
此篇為路線心得所以會有劇情雷,若只想看遊戲介紹及無雷心得請至https://vocus.cc/wow_gamereview/628209a9fd897800013930c3
Thumbnail
此篇為路線心得所以會有劇情雷,若只想看遊戲介紹及無雷心得請至https://vocus.cc/wow_gamereview/628209a9fd897800013930c3
Thumbnail
《貓博物館》遊戲適合喜歡2D橫向卷軸、恐怖獵奇、詭譎插畫風格、點擊解謎、很多貓的玩家遊玩。
Thumbnail
在創作的路上真的很多人問我說 到底要怎麼做出符合自己期待 但又可以表現得很有美感的作品?🥹 這個問題真的應該是每個創作者都一直在學習的課題吧!
Thumbnail
API是我們與其他系統介接的標準化規格, 那一份好的規格勢必要能夠達到引導與驗證的作用, 避免對方介接錯誤, 引發後續的災難性損失, 因此這一章節就是要教我們如何定義每個API的欄位怎麼填? 資料型態是什麼? 以及如何生成API文件。 我們在「【🔒 Python API框架篇 - Fas
森林裡的小兔子琪琪有一本秘密日記,裡面記錄了她每天的心情、喜歡的事物,還有她的住址和最愛吃的胡蘿蔔品牌。這些資訊對她來說非常重要,她不希望被其他動物偷看,尤其是狡猾的狐狸。 一天,琪琪覺得寫日記太麻煩了,就決定把日記內容寫在森林大樹的公告板上,這樣以後想看時,只要回來翻閱就好了。她還告訴自己:「沒
Thumbnail
Frames per second簡稱FPS, 也就是每秒幾個幀數的意思, 平常我們看到的影片背後其實都是一張張圖片的組成, 而這一幅畫面就是影片的每一幀。 由於人眼的特殊生理結構, 畫面的幀數只要高於每秒10 - 12張的時候就會認為是連貫的, 這也就是為什麼電影膠片是一格格的拍攝出來, 但是藉
Thumbnail
點陣圖 點陣圖是由許多方格像素組成的圖片, 因此我們常常在將圖片放大時會呈現像是馬賽克的狀況, 假設期望圖片越清晰那所需要的像素會較多個, 因此空間耗用量也相對較大。 常見的格式有: .JPG .PNG .GIF .BMP .TIFF等格式。 繪製程式碼: 向量圖 向量
Thumbnail
繼上次分享的「【🔒 影像辨識 - 影像處理】Ep.1 關於影像的基本單位, 相信我們對於影像的儲存應該有了基本的認識了, 那麼接下來我們會需要的是了解顏色的組成。 我們除了在文章裡講述概念之外, 也會提供實作的數位作品分享給大家, 請大家根據範例學習與練習。 關於顏色 灰階的時代 早期尚未
Thumbnail
此篇為路線心得所以會有劇情雷,若只想看遊戲介紹及無雷心得請至https://vocus.cc/wow_gamereview/628209a9fd897800013930c3
Thumbnail
此篇為路線心得所以會有劇情雷,若只想看遊戲介紹及無雷心得請至https://vocus.cc/wow_gamereview/628209a9fd897800013930c3
Thumbnail
此篇為路線心得所以會有劇情雷,若只想看遊戲介紹及無雷心得請至https://vocus.cc/wow_gamereview/628209a9fd897800013930c3
Thumbnail
《貓博物館》遊戲適合喜歡2D橫向卷軸、恐怖獵奇、詭譎插畫風格、點擊解謎、很多貓的玩家遊玩。