第二部：《深度學習》28/100 Flatten 與全連接層 📐 將特徵轉換為分類依據！

Hansen W

發佈於AI科技機器學習修煉坊

2025/09/04 更新2025/09/04 發佈閱讀 6 分鐘

AI時代系列(2) 機器學習三部曲: 🔹 第二部：《深度學習 —— 神經網路的革命》

28/100 第三週：📌 卷積神經網路 CNN

28.Flatten 與全連接層 📐 將特徵轉換為分類依據！

________________________________________

✅ 課程概念導讀：

在 CNN 模型中，前面的捲積層與池化層主要負責提取圖像特徵，但最終還是要「輸出分類結果」。這就需要透過：

1. Flatten：將多維的特徵圖壓平成一維向量

2. 全連接層（Dense）：將這些特徵組合起來進行決策與分類

________________________________________

📐 一、什麼是 Flatten？

Flatten 是將捲積後的 3D 特徵圖（高 × 寬 × 通道數）轉換成一維向量，讓資料可以進入全連接層做分類。

例子：

• 特徵圖輸出為 (7, 7, 64) → Flatten 之後為 7×7×64 = 3136 維向量

________________________________________

🧠 二、什麼是全連接層（Dense Layer）？

Dense Layer 是一個每個輸入都與每個神經元相連的層，常用於分類任務的最後幾層。

• 每個神經元的輸出為：

y=f(W⋅x+b)y

其中：

o x 是輸入向量（如 Flatten 後）

o W 是權重，b 是偏差

o f() 是激活函數（常用 ReLU / Softmax）

________________________________________

⚙️ TensorFlow / Keras 實作：

python

from tensorflow.keras import layers, models

model = models.Sequential([

layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),

layers.MaxPooling2D((2, 2)),

layers.Flatten(),

layers.Dense(128, activation='relu'),

layers.Dense(10, activation='softmax') # 10 類別分類

])

這段程式碼建立了一個典型的卷積神經網路（CNN），專為處理 28×28 灰階圖像（如 MNIST 手寫數字）而設計。模型流程如下：

首先透過 Conv2D 層提取 32 個 3×3 的局部特徵並套用 ReLU 激活，再經由 MaxPooling2D 層將特徵圖縮小一半，降低維度；接著 Flatten 將特徵圖攤平成向量，輸入至兩層全連接層：第一層具有 128 個神經元並使用 ReLU，第二層輸出 10 個節點，搭配 softmax 激活，用於進行 10 類別的分類任務。整體模型簡潔實用，適合影像分類的入門範例。

_____________________________________

🎯 為什麼不能直接分類捲積特徵圖？

問題解釋

捲積特徵圖是多維資料 Dense 層只能處理向量（1D）

每個通道有空間位置資訊必須轉換為純特徵向量，交由 Dense 層綜合判斷

模型決策需要整合特徵 Flatten 讓模型將所有特徵集中考慮

________________________________________

📊 Flatten + Dense 的常見搭配：

操作層功能說明

Flatten() 將卷積產生的特徵圖攤平成向量

Dense(128) 高層語義特徵組合 → 提取抽象關聯

Dense(10) 輸出層，對應 10 類別分類（使用 Softmax）

________________________________________

💡 額外補充：Global Average Pooling 是替代方案？

在某些模型中會用 GlobalAveragePooling2D 取代 Flatten + Dense：

• 優點：參數更少，不易過擬合

• 常用於輕量模型（如 MobileNet、EfficientNet）

python

layers.GlobalAveragePooling2D()

________________________________________

🧠 類比說明：

• 捲積層：像攝影師拍了很多細節特寫

• Flatten：把這些照片全部攤開變成一條線

• Dense：像資深編輯根據這些照片內容給出總結與判斷（這是狗還是貓？）

________________________________________

🎯 小結與啟示：

✅ Flatten 是 CNN → MLP 的橋樑

✅ Dense 層負責抽象整合所有卷積特徵，做出分類決策

✅ 結合 Softmax 或 Sigmoid，可處理多類別或二分類任務

✅ 是 CNN 模型走向「輸出結果」的最後一哩路！

Hansen W的沙龍AI科技機器學習修煉坊

留言

留言分享你的想法！

Hansen W的沙龍

19會員

520內容數

AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台，主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例，更強調理性思維與行動力的結合。無論你是AI初學者、創業者，還是追求人生升維的行者，都能在這裡找到前進的方向與志同道合的夥伴。

Hansen W的沙龍的其他內容

2025/09/04

第二部：《深度學習》27/100 批次正規化（Batch Norm）⚖️ 穩定訓練與加速收斂！

批次正規化（Batch Norm）可穩定激活分布、加速收斂並提升泛化能力，常用於卷積或全連接層後、ReLU 前。透過標準化與可學參數調整輸入分布，是 ResNet、Transformer 等架構的關鍵技術。小 batch 時可改用 Layer Norm 或 Group Norm。

2025/09/04

第二部：《深度學習》27/100 批次正規化（Batch Norm）⚖️ 穩定訓練與加速收斂！

2025/09/04

第二部：《深度學習》26/100 CNN 模型架構範例 🏛 LeNet、AlexNet 到 ResNet！

LeNet-5（1998）首次將 CNN 成功應用於手寫數字辨識；AlexNet（2012）結合 ReLU、Dropout 與 GPU 加速；ResNet（2015）提出殘差連接，解決深層網路退化問題。三者分別象徵深度學習的啟蒙、突破與深化，成為電腦視覺發展的重要里程碑。

2025/09/04

第二部：《深度學習》26/100 CNN 模型架構範例 🏛 LeNet、AlexNet 到 ResNet！

2025/09/04

第二部：《深度學習》25/100 多通道輸入與多濾鏡輸出 🎨 處理彩色圖像必備技巧！

CNN 處理彩色圖像時，輸入為多通道（如 RGB 三通道），每個濾鏡同樣擁有三維結構，對各通道分別卷積後再相加形成輸出。若使用多個濾鏡，則能同時提取不同特徵，每個濾鏡輸出一張特徵圖，形成多通道輸出。這樣的設計能捕捉邊緣、紋理與形狀等多層次資訊，是 CNN 成功應用於影像辨識的關鍵技術。

2025/09/04

第二部：《深度學習》25/100 多通道輸入與多濾鏡輸出 🎨 處理彩色圖像必備技巧！

看更多

你可能也想看

JayRay 的沙龍

【資料分析】python資料處理-特徵工程的使用時機與基礎操作語法彙整

特徵工程是機器學習中的核心技術，通過將原始數據轉換為有意義的特徵，以提升模型的準確性和穩定性。常見的特徵工程方法包括異常值檢測、特徵轉換、特徵縮放、特徵表示、特徵選擇和特徵提取。本文將深入探討這些方法的適用情況及具體實施流程，以幫助讀者有效利用特徵工程來優化機器學習模型表現。

#數據#模型#異常

2024/08/14

JayRay 的沙龍

【資料分析】python資料處理-特徵工程的使用時機與基礎操作語法彙整

#數據#模型#異常

2024/08/14

Karen的沙龍

【邁向圖神經網絡GNN】Part5: 建構 GNN model 實作 Cora 資料集結點分類任務

本篇文章介紹如何使用PyTorch構建和訓練圖神經網絡（GNN），並使用Cora資料集進行節點分類任務。通過模型架構的逐步優化，包括引入批量標準化和獨立的消息傳遞層，調整Dropout和聚合函數，顯著提高了模型的分類準確率。實驗結果表明，經過優化的GNN模型在處理圖結構數據具有強大的性能和應用潛力。

#GNN#Graph#dropout

2024/07/28