【深智書摘】只要解說夠詳盡,好的案例不需要多!讓您快速上手電腦視覺

更新於 發佈於 閱讀時間約 4 分鐘
常常聽到影像處理、Python、OpenCV等技術,最近又在流行機器學習、深度學習、CNN、人工神經網路,常常不知從何開始學習,如果有一本書能把這些知識從頭到尾講清楚有多好,再加上如果有最常用的案例實作,一定可以完整將這個現在最賺錢行業的領域變成一技之長。

【本書特色】

  • 數位影像、Python、OpenCV基礎
  • 影像加密與解密,數位浮水印、物體計數
  • 缺陷檢測、手勢辨識、答題卡辨識、隱身術、以圖搜圖
  • 手寫數字辨識、車牌辨識、指紋辨識
  • 色彩空間處理、邏輯運算、ROI(感興趣區域)
  • 計算影像輪廓、特徵值提取、比對、距離計算
  • KNN實現字元(手寫數字、英文字母)辨識
  • 求解數獨影像、SVM數字辨識
  • 行人檢測(第19章)K平均值聚類實現藝術畫
  • 影像分類、物件辨識(YOLO演算法、SSD演算法)
  • 語義分割、實例分割、風格遷移、姿勢辨識
  • 人臉檢測、人臉辨識、勾勒五官輪廓、人臉對齊
  • 表情辨識、駕駛員疲勞檢測、易容術、年齡和性別辨識

【豐富案例】

  本書透過案例來介紹相關基礎知識,儘量避免將案例作為一個孤立的問題來看待,更多地考慮基礎知識之間的銜接、組合、應用場景等,儘量以簡單明瞭的方式實現一個問題,以更進一步地幫讀者弄清問題的核心和演算法。
  本書由案例來介紹所有和影像(包括基礎演算法、機器學習、深度學習)相關技術。在基礎部分,包括了影像安全(影像加密、影像關鍵部位打碼、隱身術)、影像辨識(答題卡辨識、手勢辨識、車牌辨識、指紋辨識、手寫數字辨識)、物體計數、影像檢索、缺陷檢測等。在機器學習部分,則實作了KNN實現字元(手寫數字、英文字母)辨識、數獨影像求解(KNN)、SVM手寫數字辨識、行人檢測、藝術畫(K平均值聚類)等。在深度學習方面,包括了影像分類、物件辨識(YOLO演算法、SSD演算法)、語義分割、實例分割、風格遷移、姿勢辨識等。另外在最流行的人臉辨識相關方面,則提供了人臉檢測、人臉辨識、勾勒五官輪廓、人臉對齊、表情辨識、駕駛員疲勞檢測、易容術、性別和年齡辨識等。

【案例參考】

資訊隱藏
影像特徵是影像處理非常關鍵的步驟,通常會根據影像特徵來完成影像處理。本節將透過影像像素值的奇偶性來實現影像資訊隱藏。資訊隱藏範例如下圖所示,將數字1影像隱藏到影像中。
資訊隱藏範例
RGB通道拆分
RGB 影像是由R 通道、G 通道、B 通道三個通道組成的。需要注意的是,OpenCV 中的通道是按照B 通道→G 通道→R 通道的循序儲存的。在影像處理過程中,可以根據需要對通道進行拆分和合併。
RGB通道拆分執行結果
馬賽克
透過遮罩方式、ROI 方式實現對臉部的馬賽克及解馬賽克。
臉部加/解馬賽克過程
手勢辨識
  • 手勢辨識的範圍很廣泛,在不同場景下,有不同類型的手勢需要辨識,例如:
  • 辨識手勢所表示的數值。
  • 辨識手勢在特定遊戲中的含義,如「石頭、剪刀、布」等。
  • 辨識手勢在遊戲中表示的動作,如前進、跳躍、後退等。
  • 辨識特定手勢的含義,如表示"OK"的手勢、表示勝利的手勢等。
手勢辨識示意圖
此章節主要討論手勢在表示0~5 六個數值時的辨識問題。在辨識時,將手勢圖中凹陷區域(稱為凸缺陷)的個數作為辨識的重要依據。手勢表示數值的示意圖如下圖所示。
--
  在面對複雜的基礎知識時,有經驗的學習者會根據已有基礎知識繪製一幅與該基礎知識有關的圖,從而進一步理解該基礎知識。能夠更加清晰、直觀、細緻地將基礎知識的全域、結構、關係、流程、脈絡等訊息本體現出來。本書算是這幾年來,將所有相關領域綜合整理的一本全書,相信對有志在人工智慧的讀者來說,是最重要的一本參考書籍。
深智數位出版:〈Python+OpenCV——機器學習+深度學習40大電腦視覺案例入門到實戰〉
本文取自深智數位出版之〈Python+OpenCV——機器學習+深度學習40大電腦視覺案例入門到實戰〉
為什麼會看到廣告
avatar-img
9會員
25內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
深智數位的沙龍 的其他內容
2023年來看處理器的發展,x86_64系統結構與ARM64系統結構是目前市場上的主流處理器系統結構,ARM是一個整合作業系統、組合語言、C語言、電子電路技術的宏大領域。熟悉ARM架構一定是硬體工程師想要進軍CPU領域的唯一目標(當然還有一個是RISC-V)。
在AI已經全民運動的年代,Google還是希望有一個更小巧精美的深度學習套件讓大家都能快速上手──JAX就這麼誕生了。 現在,你真的可以放心的進入JAX的世界,當你上手之後,不論是CNN、RNN、NLP或是GAN,全部可以又快又好又清楚的做出來
2306 WordPress可以做到的,不僅僅是SEO,它還能夠整合Facebook、Instagram、廣告投放,將社群行銷的效益發揮到最大。 同樣是架設網站,為什麼不選擇一個投資報酬率最大的網站呢?
在CPU世界,大型商業機構掌握了處理器的設計,使得我們也必須屈從於封閉式的CPU架構。這也是為什麼目前個人電腦只有AMD和Intel兩家可以選擇。然而在RISC-V的出現,我們終於嗅到了CPU世界的自由氣息。
馬克•庫班(NBA獨行俠隊老闆,億萬富翁)說過:「人工智慧、深度學習和機器學習,不論你現在是否能夠理解這些概念,你都應該學習。否則三年內,你就會像被滅絕的恐龍一樣被社會淘汰。現在不開始,以後就來不及了。」
人們透過機器學習(machine learning),試著讓電腦能夠從大量資料中學習成長,不僅可以運用在生活各方面的功能提升,甚至還能透過這些既有的資料,起到鑑往知來的效果,處在當今資訊爆炸的時代,正是你開始學機器學習的最好時機!
2023年來看處理器的發展,x86_64系統結構與ARM64系統結構是目前市場上的主流處理器系統結構,ARM是一個整合作業系統、組合語言、C語言、電子電路技術的宏大領域。熟悉ARM架構一定是硬體工程師想要進軍CPU領域的唯一目標(當然還有一個是RISC-V)。
在AI已經全民運動的年代,Google還是希望有一個更小巧精美的深度學習套件讓大家都能快速上手──JAX就這麼誕生了。 現在,你真的可以放心的進入JAX的世界,當你上手之後,不論是CNN、RNN、NLP或是GAN,全部可以又快又好又清楚的做出來
2306 WordPress可以做到的,不僅僅是SEO,它還能夠整合Facebook、Instagram、廣告投放,將社群行銷的效益發揮到最大。 同樣是架設網站,為什麼不選擇一個投資報酬率最大的網站呢?
在CPU世界,大型商業機構掌握了處理器的設計,使得我們也必須屈從於封閉式的CPU架構。這也是為什麼目前個人電腦只有AMD和Intel兩家可以選擇。然而在RISC-V的出現,我們終於嗅到了CPU世界的自由氣息。
馬克•庫班(NBA獨行俠隊老闆,億萬富翁)說過:「人工智慧、深度學習和機器學習,不論你現在是否能夠理解這些概念,你都應該學習。否則三年內,你就會像被滅絕的恐龍一樣被社會淘汰。現在不開始,以後就來不及了。」
人們透過機器學習(machine learning),試著讓電腦能夠從大量資料中學習成長,不僅可以運用在生活各方面的功能提升,甚至還能透過這些既有的資料,起到鑑往知來的效果,處在當今資訊爆炸的時代,正是你開始學機器學習的最好時機!
你可能也想看
Google News 追蹤
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
特徵工程是機器學習中的核心技術,通過將原始數據轉換為有意義的特徵,以提升模型的準確性和穩定性。常見的特徵工程方法包括異常值檢測、特徵轉換、特徵縮放、特徵表示、特徵選擇和特徵提取。本文將深入探討這些方法的適用情況及具體實施流程,以幫助讀者有效利用特徵工程來優化機器學習模型表現。
Microsoft Azure AI 900 證照,把準備資料整理分享給大家。 AI 是可模仿人類行為與能力的軟體,主要的工作包含: 機器學習:這通常是 AI 系統的基礎,且是「指導」電腦模型進行預測並從資料中得出結論的方式 電腦視覺:透過相機、影片和影像,以視覺方式解譯世界的 AI 功能
Thumbnail
GNN發展背景 傳統的深度學習模型如在計算機視覺(CV)和自然語言處理(NLP)領域中極為成功,主要是處理結構化數據如影像和文本。這些數據類型通常具有固定且規律的結構,例如影像是由有序的像素點組成。然而,在真實世界中,許多數據是非結構化的,如化合物結構(原子和分子)。這些數據雖然具有一定的規則性,
Thumbnail
在影像辨識中,若遇到物件與背景難以分辨的狀況下,先做一下色彩分析,知道了色彩強度階層上的像素數,有助於了解後續需要做什麼處理,比較好分割出辨識物。 若想辨識的物件與背景的RGB值過於接近,也比較好說明此狀況,為什麼較難分割出物件。 成果呈現 第一張圖:左邊為原圖,右邊為分析結果的圖,用其他顏
Thumbnail
卷積神經網路(CNN)是一種專門用於影像相關應用的神經網路。本文介紹了CNN在影像辨識中的應用,包括圖片的組成、Receptive Field、Parameter Sharing、以及Pooling等技術。通過本文,讀者將瞭解CNN在影像辨識領域的優勢和運作原理。
Thumbnail
針對辨識物的不同,流程就會不一樣,在依照現實狀況進行刪減,以下說明為個人常用的流程。 基本流程: 讀圖 灰階 濾波 (看圖片雜訊多不多) 二值化 連通區域 特徵篩選 特徵資訊 辨識 - (OCR,量測,瑕疵檢測等。) 名詞介紹 Gray 灰階 將原始的彩色圖像轉換為灰階圖
Thumbnail
形態學操作在影像處理中有多種應用,特別是在處理二值化影像(黑白影像)。 在影像處理應用上,基本上都由侵蝕,膨脹這兩種方法,組合搭配而成。 常見應用場景 物體檢測與分割: 形態學操作可以用於增強或改善二值化影像中的物體邊界,使得物體的檢測和分割更加準確。
Thumbnail
本文將介紹影像的基本操作包括:影像的讀取、顯示、保存,以及一些常見的操作如裁剪、旋轉、縮放等。 語法介紹 讀取影像: cv2.imread函數的參數是影像的檔案路徑。讀取後的影像以NumPy的ndarray形式表示。
Thumbnail
本文介紹如何使用OpenCV的分水嶺演算法來實作硬幣的影像分割。除了官方範例外,還加入取出分割後物件的中心點來標註的功能。透過二值化、距離圖、前景圖、分割背景圖等步驟,最後應用分水嶺演算法進行硬幣的分割。本文也提供程式範例及圖示逐步解析演算法。
Thumbnail
[影像處理_OpenCV Python]使用Python撰寫影像處理功能,圖片遮罩或濾除掉不要的地方,旋轉圖片 以下範例將呈現影像處理三種不同的應用: 遮罩的實現 濾除 旋轉
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
特徵工程是機器學習中的核心技術,通過將原始數據轉換為有意義的特徵,以提升模型的準確性和穩定性。常見的特徵工程方法包括異常值檢測、特徵轉換、特徵縮放、特徵表示、特徵選擇和特徵提取。本文將深入探討這些方法的適用情況及具體實施流程,以幫助讀者有效利用特徵工程來優化機器學習模型表現。
Microsoft Azure AI 900 證照,把準備資料整理分享給大家。 AI 是可模仿人類行為與能力的軟體,主要的工作包含: 機器學習:這通常是 AI 系統的基礎,且是「指導」電腦模型進行預測並從資料中得出結論的方式 電腦視覺:透過相機、影片和影像,以視覺方式解譯世界的 AI 功能
Thumbnail
GNN發展背景 傳統的深度學習模型如在計算機視覺(CV)和自然語言處理(NLP)領域中極為成功,主要是處理結構化數據如影像和文本。這些數據類型通常具有固定且規律的結構,例如影像是由有序的像素點組成。然而,在真實世界中,許多數據是非結構化的,如化合物結構(原子和分子)。這些數據雖然具有一定的規則性,
Thumbnail
在影像辨識中,若遇到物件與背景難以分辨的狀況下,先做一下色彩分析,知道了色彩強度階層上的像素數,有助於了解後續需要做什麼處理,比較好分割出辨識物。 若想辨識的物件與背景的RGB值過於接近,也比較好說明此狀況,為什麼較難分割出物件。 成果呈現 第一張圖:左邊為原圖,右邊為分析結果的圖,用其他顏
Thumbnail
卷積神經網路(CNN)是一種專門用於影像相關應用的神經網路。本文介紹了CNN在影像辨識中的應用,包括圖片的組成、Receptive Field、Parameter Sharing、以及Pooling等技術。通過本文,讀者將瞭解CNN在影像辨識領域的優勢和運作原理。
Thumbnail
針對辨識物的不同,流程就會不一樣,在依照現實狀況進行刪減,以下說明為個人常用的流程。 基本流程: 讀圖 灰階 濾波 (看圖片雜訊多不多) 二值化 連通區域 特徵篩選 特徵資訊 辨識 - (OCR,量測,瑕疵檢測等。) 名詞介紹 Gray 灰階 將原始的彩色圖像轉換為灰階圖
Thumbnail
形態學操作在影像處理中有多種應用,特別是在處理二值化影像(黑白影像)。 在影像處理應用上,基本上都由侵蝕,膨脹這兩種方法,組合搭配而成。 常見應用場景 物體檢測與分割: 形態學操作可以用於增強或改善二值化影像中的物體邊界,使得物體的檢測和分割更加準確。
Thumbnail
本文將介紹影像的基本操作包括:影像的讀取、顯示、保存,以及一些常見的操作如裁剪、旋轉、縮放等。 語法介紹 讀取影像: cv2.imread函數的參數是影像的檔案路徑。讀取後的影像以NumPy的ndarray形式表示。
Thumbnail
本文介紹如何使用OpenCV的分水嶺演算法來實作硬幣的影像分割。除了官方範例外,還加入取出分割後物件的中心點來標註的功能。透過二值化、距離圖、前景圖、分割背景圖等步驟,最後應用分水嶺演算法進行硬幣的分割。本文也提供程式範例及圖示逐步解析演算法。
Thumbnail
[影像處理_OpenCV Python]使用Python撰寫影像處理功能,圖片遮罩或濾除掉不要的地方,旋轉圖片 以下範例將呈現影像處理三種不同的應用: 遮罩的實現 濾除 旋轉