卷積神經網路 (CNN - Convolutional Neural Network)

更新 發佈閱讀 5 分鐘

「卷積神經網路 (CNN - Convolutional Neural Network)」是一種特別設計來處理具有網格結構數據(例如圖像)的深度學習模型。它在電腦視覺領域取得了巨大的成功,並被廣泛應用於圖像分類、目標檢測、圖像分割等多種任務中。

你可以將卷積神經網路想像成一種具有特殊「眼睛」的AI,這些「眼睛」可以自動檢測圖像中的各種視覺特徵,例如邊緣、紋理、形狀和物體。

CNN 的主要組成部分:

  1. 卷積層 (Convolutional Layer): 這是 CNN 的核心 building block。卷積層使用一些小的可學習的濾波器(也稱為核或卷積核)在輸入圖像上滑動,並在每個位置執行卷積運算。卷積運算實際上是將濾波器的權重與輸入圖像中對應位置的像素值進行點乘,然後將結果相加。這個過程可以提取圖像中的局部特徵,例如邊緣、角點、紋理等。通過使用多個不同的濾波器,卷積層可以提取多種不同的特徵。
  2. 激活函數 (Activation Function): 在每個卷積層之後,通常會應用一個非線性激活函數,例如 ReLU (Rectified Linear Unit)。激活函數的作用是引入非線性,使得模型可以學習更複雜的模式。
  3. 池化層 (Pooling Layer): 池化層通常放在卷積層之後,用於減小特徵圖的空間尺寸(寬度和高度),從而減少模型的參數數量和計算量,並提高模型對圖像微小變化的魯棒性(例如平移不變性)。常見的池化操作包括:
    • 最大池化 (Max Pooling): 在每個池化窗口中選擇最大的像素值作為輸出。 平均池化 (Average Pooling): 在每個池化窗口中計算所有像素值的平均值作為輸出。
  4. 全連接層 (Fully Connected Layer): 在經過多個卷積層和池化層的處理後,最終的特徵圖會被展平成一個一維向量,然後輸入到一個或多個全連接層中。全連接層與傳統的神經網路層類似,每個神經元都與前一層的所有神經元相連接。全連接層通常用於執行最終的分類或回歸任務。
  5. 輸出層 (Output Layer): 最後一個全連接層的輸出會通過一個激活函數(例如 Softmax 用於多類別分類,Sigmoid 用於二元分類)生成最終的預測結果。

CNN 的工作原理:

CNN 通過堆疊多個卷積層、激活函數和池化層來逐步提取圖像中的層次化特徵。底層的卷積層通常學習到圖像的低級特徵(例如邊緣和角點),而更深的卷積層則可以學習到更高級、更複雜的特徵(例如物體的部件和整體形狀)。全連接層則利用這些提取到的特徵進行最終的分類或預測。

CNN 在電腦視覺中的優勢:

  • 局部感受野 (Local Receptive Fields): 卷積層的每個神經元只關注輸入圖像的一個局部區域,這種局部連接的方式更符合視覺皮層的工作方式,並且可以有效地提取局部特徵。
  • 權重共享 (Weight Sharing): 同一個卷積層中的所有濾波器在整個輸入圖像上滑動時,都使用相同的權重。這樣可以大大減少模型的參數數量,提高訓練效率,並使模型具有一定的平移不變性。
  • 層次化特徵學習 (Hierarchical Feature Learning): 通過多個卷積層的堆疊,CNN 可以自動地學習到從低級到高級的層次化特徵表示。

CNN 的應用:

CNN 在電腦視覺領域有著廣泛的應用,包括但不限於:

  • 圖像分類 (Image Classification): 識別圖像中包含的物體或場景。
  • 目標檢測 (Object Detection): 在圖像中找到並標註出特定物體的位置。
  • 圖像分割 (Image Segmentation): 將圖像中的每個像素分類到不同的類別。
  • 人臉辨識 (Face Recognition): 識別圖像或影片中的人臉。
  • 圖像生成 (Image Generation): 使用生成對抗網路 (GANs) 等技術生成新的圖像。
  • 圖像描述 (Image Captioning): 自動生成描述圖像內容的文本。
  • 影片分析 (Video Analysis): 分析影片中的內容、動作和事件。

總之,卷積神經網路是一種強大的深度學習模型,它通過特殊的網絡結構和學習機制,非常擅長處理圖像數據,並在電腦視覺領域取得了革命性的突破。

留言
avatar-img
留言分享你的想法!
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
19會員
495內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)
2025/05/26
「Dropout」是一種在深度學習中常用的正則化 (Regularization) 技術,主要用於防止神經網路過擬合 (Overfitting)。 你可以將 Dropout 想像成在訓練過程中,隨機地讓網路中的一些神經元「暫時休息」,不參與本次的向前傳播和反向傳播過程。 Dropout 的工作原
2025/05/26
「Dropout」是一種在深度學習中常用的正則化 (Regularization) 技術,主要用於防止神經網路過擬合 (Overfitting)。 你可以將 Dropout 想像成在訓練過程中,隨機地讓網路中的一些神經元「暫時休息」,不參與本次的向前傳播和反向傳播過程。 Dropout 的工作原
2025/05/26
「批次標準化 (BN - Batch Normalization)」是一種在深度學習中廣泛使用的技術,特別是在訓練非常深的網路(例如 CNN)時,用於提高模型的性能和穩定性。它通過標準化(即將數據調整為具有零均值和單位方差)網路中每一層的輸入來實現這一點。 你可以將批次標準化想像成在每一層神經元接
2025/05/26
「批次標準化 (BN - Batch Normalization)」是一種在深度學習中廣泛使用的技術,特別是在訓練非常深的網路(例如 CNN)時,用於提高模型的性能和穩定性。它通過標準化(即將數據調整為具有零均值和單位方差)網路中每一層的輸入來實現這一點。 你可以將批次標準化想像成在每一層神經元接
2025/05/26
「ReLU (Rectified Linear Unit)」是一種非常常見且廣泛應用於人工神經網路(包括卷積神經網路)中的激活函數。 你可以將激活函數想像成神經元中的一個開關,它決定了神經元的輸出應該是什麼。ReLU 函數尤其簡單且有效。 ReLU 的數學定義: ReLU 函數的數學表達式非常
2025/05/26
「ReLU (Rectified Linear Unit)」是一種非常常見且廣泛應用於人工神經網路(包括卷積神經網路)中的激活函數。 你可以將激活函數想像成神經元中的一個開關,它決定了神經元的輸出應該是什麼。ReLU 函數尤其簡單且有效。 ReLU 的數學定義: ReLU 函數的數學表達式非常
看更多
你可能也想看
Thumbnail
透過蝦皮分潤計畫,輕鬆賺取零用金!本文分享5-6月實測心得,包含數據流程、實際收入、平臺優點及注意事項,並推薦高分潤商品,教你如何運用空閒時間創造被動收入。
Thumbnail
透過蝦皮分潤計畫,輕鬆賺取零用金!本文分享5-6月實測心得,包含數據流程、實際收入、平臺優點及注意事項,並推薦高分潤商品,教你如何運用空閒時間創造被動收入。
Thumbnail
單身的人有些會養寵物,而我養植物。畢竟寵物離世會傷心,植物沒養好再接再厲就好了~(笑)
Thumbnail
單身的人有些會養寵物,而我養植物。畢竟寵物離世會傷心,植物沒養好再接再厲就好了~(笑)
Thumbnail
不知你有沒有過這種經驗?衛生紙只剩最後一包、洗衣精倒不出來,或電池突然沒電。這次一次補貨,從電池、衛生紙到洗衣精,還順便分享使用心得。更棒的是,搭配蝦皮分潤計畫,愛用品不僅自己用得安心,分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E,輕鬆上手,隨時隨地賺取分潤!
Thumbnail
不知你有沒有過這種經驗?衛生紙只剩最後一包、洗衣精倒不出來,或電池突然沒電。這次一次補貨,從電池、衛生紙到洗衣精,還順便分享使用心得。更棒的是,搭配蝦皮分潤計畫,愛用品不僅自己用得安心,分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E,輕鬆上手,隨時隨地賺取分潤!
Thumbnail
身為一個典型的社畜,上班時間被會議、進度、KPI 塞得滿滿,下班後只想要找一個能夠安靜喘口氣的小角落。對我來說,畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉,還是慢慢描繪喜歡的插畫人物,那個專注在筆觸和色彩的過程,就像在幫心靈按摩一樣,讓緊繃的神經慢慢鬆開。
Thumbnail
身為一個典型的社畜,上班時間被會議、進度、KPI 塞得滿滿,下班後只想要找一個能夠安靜喘口氣的小角落。對我來說,畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉,還是慢慢描繪喜歡的插畫人物,那個專注在筆觸和色彩的過程,就像在幫心靈按摩一樣,讓緊繃的神經慢慢鬆開。
Thumbnail
神經處理單元(NPU)主要用於加速人工智慧(AI)和機器學習(ML)任務。 以下是一些主要的應用領域和使用者: AI和機器學習:NPU是人工智慧和機器學習領域的直接受益者。這些技術依賴數據而蓬勃發展,NPU擅長消化和解釋大量資料集,使機器能夠以前所未有的速度學習。 智慧型設備和物聯網:在智慧型
Thumbnail
神經處理單元(NPU)主要用於加速人工智慧(AI)和機器學習(ML)任務。 以下是一些主要的應用領域和使用者: AI和機器學習:NPU是人工智慧和機器學習領域的直接受益者。這些技術依賴數據而蓬勃發展,NPU擅長消化和解釋大量資料集,使機器能夠以前所未有的速度學習。 智慧型設備和物聯網:在智慧型
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
人工智慧的浪潮正在席捲全球,而生成式AI更是成為當前最炙手可熱的焦點。透過強大的計算能力和創新的算法,生成式AI可以生成逼真的圖像、文字和語音,為各個領域帶來前所未有的創新和突破。
Thumbnail
人工智慧的浪潮正在席捲全球,而生成式AI更是成為當前最炙手可熱的焦點。透過強大的計算能力和創新的算法,生成式AI可以生成逼真的圖像、文字和語音,為各個領域帶來前所未有的創新和突破。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
感知器是一種基本的神經網路模型,用於二分類問題。它模擬了人腦神經元的工作原理,通過調整權重和偏差值來達到預測和分類的目的。 感知器流程 輸入 資料的輸入: 輸入層接受資料的輸入,每個輸入對應一個特徵,還有一個固定的偏差神經元。 資料經過每個神經元時,會乘上相應的
Thumbnail
感知器是一種基本的神經網路模型,用於二分類問題。它模擬了人腦神經元的工作原理,通過調整權重和偏差值來達到預測和分類的目的。 感知器流程 輸入 資料的輸入: 輸入層接受資料的輸入,每個輸入對應一個特徵,還有一個固定的偏差神經元。 資料經過每個神經元時,會乘上相應的
Thumbnail
本文章探討了多智能體系統(MAS)在生成式AI領域中的應用,以及GenAI對於AI_MCU和Software defined hardware的影響。文章還總結了SDH設計模式對數據科學和人工智能時代的影響,並提供了有關GenAI的一些額外信息。
Thumbnail
本文章探討了多智能體系統(MAS)在生成式AI領域中的應用,以及GenAI對於AI_MCU和Software defined hardware的影響。文章還總結了SDH設計模式對數據科學和人工智能時代的影響,並提供了有關GenAI的一些額外信息。
Thumbnail
AI應用遍地開花,討論AI晶片的同時,也來認識一下台積電的其中一項先進封裝技術CoWoS,本篇試圖簡單說明。
Thumbnail
AI應用遍地開花,討論AI晶片的同時,也來認識一下台積電的其中一項先進封裝技術CoWoS,本篇試圖簡單說明。
Thumbnail
NVIDIA的Blackwell計算平台代表著實時生成式AI應用的重大進步,旨在滿足跨行業挑戰。此平台提升了計算效能,促進了AI在實體世界的應用,並對從自動駕駛到醫療診斷等多個領域產生了深遠影響。NVIDIA 黃仁勳的願景是將AI技術從虛擬世界帶入現實,為創新開闢新道路,一個更加智慧和互聯的未來。
Thumbnail
NVIDIA的Blackwell計算平台代表著實時生成式AI應用的重大進步,旨在滿足跨行業挑戰。此平台提升了計算效能,促進了AI在實體世界的應用,並對從自動駕駛到醫療診斷等多個領域產生了深遠影響。NVIDIA 黃仁勳的願景是將AI技術從虛擬世界帶入現實,為創新開闢新道路,一個更加智慧和互聯的未來。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News