池化層 (Pooling Layer)

iPAS AI應用規劃師學習筆記

發佈於電腦視覺技術與應用

2025/08/08 更新2025/05/26 發佈閱讀 4 分鐘

「池化層 (Pooling Layer)」是卷積神經網路 (CNN) 中一個重要的組成部分，通常會放在一個或多個卷積層之後。池化層的主要作用是減小特徵圖的空間尺寸（寬度和高度），同時保留重要的特徵信息。

你可以將池化層想像成對卷積層輸出的特徵圖進行「濃縮」或「概括」，從而降低數據的複雜性。

池化層的主要功能和目的：

降低計算複雜度 (Reduce Computational Complexity): 通過減小特徵圖的尺寸，池化層可以減少後續層（尤其是全連接層）的參數數量，從而降低模型的計算量和訓練時間。
提高對平移、縮放和旋轉的魯棒性 (Increase Robustness to Translations, Scaling, and Rotations): 池化操作通常會對局部區域的特徵進行匯總，這樣即使輸入圖像中的物體發生了微小的平移、縮放或旋轉，模型仍然可能檢測到相同的特徵。這有助於提高模型的泛化能力。
提取主要特徵 (Extract Dominant Features): 池化操作（尤其是最大池化）傾向於保留每個局部區域中最顯著的特徵響應，從而使得模型更加關注重要的信息。

池化層的工作原理：

與卷積層類似，池化層也會在輸入的每個特徵圖上滑動一個固定大小的窗口（稱為池化窗口）。對於每個窗口內的像素值，池化層會執行一個特定的聚合操作，並將結果作為輸出特徵圖中對應位置的值。

常見的池化操作包括：

最大池化 (Max Pooling):
例子：如果池化窗口大小是 2x2，步長是 2，那麼對於輸入特徵圖的一個 2x2 區域：
[[9, 1], [2, 8]]
最大池化的輸出將是 9。
- 在池化窗口中，選擇數值最大的像素作為輸出。最大池化是最常用的池化操作，它傾向於保留每個局部區域中最活躍的特徵。
平均池化 (Average Pooling):
例子：對於相同的 2x2 區域：
[[9, 1], [2, 8]]
平均池化的輸出將是 (9 + 1 + 2 + 8) / 4 = 5。
- 在池化窗口中，計算所有像素值的平均值作為輸出。平均池化可以平滑特徵圖，並提供區域的平均響應。

池化層的參數：

池化層通常有兩個主要的超參數：

池化窗口大小 (Pool Size / Kernel Size): 定義了在每個滑動窗口中進行聚合操作的區域大小（例如 2x2、3x3）。
步長 (Stride): 定義了池化窗口在輸入特徵圖上滑動時每次移動的步數。通常情況下，為了減小尺寸，步長會設置得等於池化窗口的大小，這樣可以避免窗口重疊。

池化層在 CNN 中的位置：

池化層通常會緊跟在一個或多個卷積層之後。在一個典型的 CNN 架構中，可能會有多個卷積層和池化層交替出現，以便逐步提取更高級別的特徵並減小數據的空間尺寸。在最後的幾個階段，通常會將特徵圖展平成一維向量，然後輸入到全連接層進行最終的分類或預測。

總結來說，池化層是 CNN 中用於減小特徵圖尺寸、提高魯棒性和提取主要特徵的重要組件。最大池化和平均池化是兩種最常見的池化操作。

含 AI 應用內容

郝信華 iPAS AI應用規劃師學習筆記電腦視覺技術與應用卷積神經網路核心原理

留言

留言分享你的想法！

郝信華 iPAS AI應用規劃師學習筆記

25會員

495內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/05/26

Dropout

「Dropout」是一種在深度學習中常用的正則化 (Regularization) 技術，主要用於防止神經網路過擬合 (Overfitting)。你可以將 Dropout 想像成在訓練過程中，隨機地讓網路中的一些神經元「暫時休息」，不參與本次的向前傳播和反向傳播過程。 Dropout 的工作原

2025/05/26

Dropout

2025/05/26

批次標準化 (BN - Batch Normalization)

「批次標準化 (BN - Batch Normalization)」是一種在深度學習中廣泛使用的技術，特別是在訓練非常深的網路（例如 CNN）時，用於提高模型的性能和穩定性。它通過標準化（即將數據調整為具有零均值和單位方差）網路中每一層的輸入來實現這一點。你可以將批次標準化想像成在每一層神經元接

2025/05/26

批次標準化 (BN - Batch Normalization)

2025/05/26

ReLU (Rectified Linear Unit)

「ReLU (Rectified Linear Unit)」是一種非常常見且廣泛應用於人工神經網路（包括卷積神經網路）中的激活函數。你可以將激活函數想像成神經元中的一個開關，它決定了神經元的輸出應該是什麼。ReLU 函數尤其簡單且有效。 ReLU 的數學定義： ReLU 函數的數學表達式非常

2025/05/26

ReLU (Rectified Linear Unit)

看更多

你可能也想看

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15