第二部:《深度學習》28/100 Flatten 與全連接層 📐 將特徵轉換為分類依據!

更新 發佈閱讀 6 分鐘

AI時代系列(2) 機器學習三部曲: 🔹 第二部:《深度學習 —— 神經網路的革命》

28/100 第三週:📌 卷積神經網路 CNN

28.Flatten 與全連接層 📐 將特徵轉換為分類依據!

________________________________________

✅ 課程概念導讀:

在 CNN 模型中,前面的捲積層與池化層主要負責提取圖像特徵,但最終還是要「輸出分類結果」。這就需要透過:

1. Flatten:將多維的特徵圖壓平成一維向量

2. 全連接層(Dense):將這些特徵組合起來進行決策與分類

________________________________________

📐 一、什麼是 Flatten?

Flatten 是將捲積後的 3D 特徵圖(高 × 寬 × 通道數)轉換成一維向量,讓資料可以進入全連接層做分類。

例子:

特徵圖輸出為 (7, 7, 64) → Flatten 之後為 7×7×64 = 3136 維向量

________________________________________

🧠 二、什麼是全連接層(Dense Layer)?

Dense Layer 是一個每個輸入都與每個神經元相連的層,常用於分類任務的最後幾層。

每個神經元的輸出為:

y=f(W⋅x+b)y

其中:

o x 是輸入向量(如 Flatten 後)

o W 是權重,b 是偏差

o f() 是激活函數(常用 ReLU / Softmax)

________________________________________

⚙️ TensorFlow / Keras 實作:

python

from tensorflow.keras import layers, models

model = models.Sequential([

layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),

layers.MaxPooling2D((2, 2)),

layers.Flatten(),

layers.Dense(128, activation='relu'),

layers.Dense(10, activation='softmax') # 10 類別分類

])

這段程式碼建立了一個典型的卷積神經網路(CNN),專為處理 28×28 灰階圖像(如 MNIST 手寫數字)而設計。模型流程如下:

首先透過 Conv2D 層提取 32 個 3×3 的局部特徵並套用 ReLU 激活,再經由 MaxPooling2D 層將特徵圖縮小一半,降低維度;接著 Flatten 將特徵圖攤平成向量,輸入至兩層全連接層:第一層具有 128 個神經元並使用 ReLU,第二層輸出 10 個節點,搭配 softmax 激活,用於進行 10 類別的分類任務。整體模型簡潔實用,適合影像分類的入門範例。

_____________________________________

🎯 為什麼不能直接分類捲積特徵圖?

問題 解釋

捲積特徵圖是多維資料 Dense 層只能處理向量(1D)

每個通道有空間位置資訊 必須轉換為純特徵向量,交由 Dense 層綜合判斷

模型決策需要整合特徵 Flatten 讓模型將所有特徵集中考慮

________________________________________

📊 Flatten + Dense 的常見搭配:

操作層 功能說明

Flatten() 將卷積產生的特徵圖攤平成向量

Dense(128) 高層語義特徵組合 → 提取抽象關聯

Dense(10) 輸出層,對應 10 類別分類(使用 Softmax)

________________________________________

💡 額外補充:Global Average Pooling 是替代方案?

在某些模型中會用 GlobalAveragePooling2D 取代 Flatten + Dense:

優點:參數更少,不易過擬合

常用於輕量模型(如 MobileNet、EfficientNet)

python

layers.GlobalAveragePooling2D()

________________________________________

🧠 類比說明:

捲積層:像攝影師拍了很多細節特寫

Flatten:把這些照片全部攤開變成一條線

Dense:像資深編輯根據這些照片內容給出總結與判斷(這是狗還是貓?)

________________________________________

🎯 小結與啟示:

✅ Flatten 是 CNN → MLP 的橋樑

✅ Dense 層負責抽象整合所有卷積特徵,做出分類決策

✅ 結合 Softmax 或 Sigmoid,可處理多類別或二分類任務

✅ 是 CNN 模型走向「輸出結果」的最後一哩路!


留言
avatar-img
留言分享你的想法!
avatar-img
Hansen W的沙龍
9會員
274內容數
AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台,主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例,更強調理性思維與行動力的結合。無論你是AI初學者、創業者,還是追求人生升維的行者,都能在這裡找到前進的方向與志同道合的夥伴。
Hansen W的沙龍的其他內容
2025/09/04
批次正規化(Batch Norm)可穩定激活分布、加速收斂並提升泛化能力,常用於卷積或全連接層後、ReLU 前。透過標準化與可學參數調整輸入分布,是 ResNet、Transformer 等架構的關鍵技術。小 batch 時可改用 Layer Norm 或 Group Norm。
2025/09/04
批次正規化(Batch Norm)可穩定激活分布、加速收斂並提升泛化能力,常用於卷積或全連接層後、ReLU 前。透過標準化與可學參數調整輸入分布,是 ResNet、Transformer 等架構的關鍵技術。小 batch 時可改用 Layer Norm 或 Group Norm。
2025/09/04
LeNet-5(1998)首次將 CNN 成功應用於手寫數字辨識;AlexNet(2012)結合 ReLU、Dropout 與 GPU 加速;ResNet(2015)提出殘差連接,解決深層網路退化問題。三者分別象徵深度學習的啟蒙、突破與深化,成為電腦視覺發展的重要里程碑。
2025/09/04
LeNet-5(1998)首次將 CNN 成功應用於手寫數字辨識;AlexNet(2012)結合 ReLU、Dropout 與 GPU 加速;ResNet(2015)提出殘差連接,解決深層網路退化問題。三者分別象徵深度學習的啟蒙、突破與深化,成為電腦視覺發展的重要里程碑。
2025/09/04
CNN 處理彩色圖像時,輸入為多通道(如 RGB 三通道),每個濾鏡同樣擁有三維結構,對各通道分別卷積後再相加形成輸出。若使用多個濾鏡,則能同時提取不同特徵,每個濾鏡輸出一張特徵圖,形成多通道輸出。這樣的設計能捕捉邊緣、紋理與形狀等多層次資訊,是 CNN 成功應用於影像辨識的關鍵技術。
2025/09/04
CNN 處理彩色圖像時,輸入為多通道(如 RGB 三通道),每個濾鏡同樣擁有三維結構,對各通道分別卷積後再相加形成輸出。若使用多個濾鏡,則能同時提取不同特徵,每個濾鏡輸出一張特徵圖,形成多通道輸出。這樣的設計能捕捉邊緣、紋理與形狀等多層次資訊,是 CNN 成功應用於影像辨識的關鍵技術。
看更多
你可能也想看
Thumbnail
在小小的租屋房間裡,透過蝦皮購物平臺採購各種黏土、模型、美甲材料等創作素材,打造專屬黏土小宇宙的療癒過程。文中分享多個蝦皮挖寶地圖,並推薦蝦皮分潤計畫。
Thumbnail
在小小的租屋房間裡,透過蝦皮購物平臺採購各種黏土、模型、美甲材料等創作素材,打造專屬黏土小宇宙的療癒過程。文中分享多個蝦皮挖寶地圖,並推薦蝦皮分潤計畫。
Thumbnail
小蝸和小豬因購物習慣不同常起衝突,直到發現蝦皮分潤計畫,讓小豬的購物愛好產生價值,也讓小蝸開始欣賞另一半的興趣。想增加收入或改善伴侶間的購物觀念差異?讓蝦皮分潤計畫成為你們的神隊友吧!
Thumbnail
小蝸和小豬因購物習慣不同常起衝突,直到發現蝦皮分潤計畫,讓小豬的購物愛好產生價值,也讓小蝸開始欣賞另一半的興趣。想增加收入或改善伴侶間的購物觀念差異?讓蝦皮分潤計畫成為你們的神隊友吧!
Thumbnail
特徵工程是機器學習中的核心技術,通過將原始數據轉換為有意義的特徵,以提升模型的準確性和穩定性。常見的特徵工程方法包括異常值檢測、特徵轉換、特徵縮放、特徵表示、特徵選擇和特徵提取。本文將深入探討這些方法的適用情況及具體實施流程,以幫助讀者有效利用特徵工程來優化機器學習模型表現。
Thumbnail
特徵工程是機器學習中的核心技術,通過將原始數據轉換為有意義的特徵,以提升模型的準確性和穩定性。常見的特徵工程方法包括異常值檢測、特徵轉換、特徵縮放、特徵表示、特徵選擇和特徵提取。本文將深入探討這些方法的適用情況及具體實施流程,以幫助讀者有效利用特徵工程來優化機器學習模型表現。
Thumbnail
本篇文章介紹如何使用PyTorch構建和訓練圖神經網絡(GNN),並使用Cora資料集進行節點分類任務。通過模型架構的逐步優化,包括引入批量標準化和獨立的消息傳遞層,調整Dropout和聚合函數,顯著提高了模型的分類準確率。實驗結果表明,經過優化的GNN模型在處理圖結構數據具有強大的性能和應用潛力。
Thumbnail
本篇文章介紹如何使用PyTorch構建和訓練圖神經網絡(GNN),並使用Cora資料集進行節點分類任務。通過模型架構的逐步優化,包括引入批量標準化和獨立的消息傳遞層,調整Dropout和聚合函數,顯著提高了模型的分類準確率。實驗結果表明,經過優化的GNN模型在處理圖結構數據具有強大的性能和應用潛力。
Thumbnail
本文參考TensorFlow官網Deep Convolutional Generative Adversarial Network的程式碼來加以實作說明。 示範如何使用深度卷積生成對抗網路(DCGAN) 生成手寫數位影像。
Thumbnail
本文參考TensorFlow官網Deep Convolutional Generative Adversarial Network的程式碼來加以實作說明。 示範如何使用深度卷積生成對抗網路(DCGAN) 生成手寫數位影像。
Thumbnail
本文將延續上一篇文章,經由訓練好的GAN模型中的生成器來生成圖片 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 [深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇 相較之下CNN的GAN生成的效果比較好,但模型也相對比較複雜,訓練時間花的也比較
Thumbnail
本文將延續上一篇文章,經由訓練好的GAN模型中的生成器來生成圖片 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 [深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇 相較之下CNN的GAN生成的效果比較好,但模型也相對比較複雜,訓練時間花的也比較
Thumbnail
延續上一篇訓練GAM模型,這次我們讓神經網路更多層更複雜一點,來看訓練生成的圖片是否效果會更好。 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 資料集分割處理的部分在延續上篇文章,從第五點開始後修改即可,前面都一樣 訓練過程,比較圖 是不是CNN的效果比MLP還要好,
Thumbnail
延續上一篇訓練GAM模型,這次我們讓神經網路更多層更複雜一點,來看訓練生成的圖片是否效果會更好。 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 資料集分割處理的部分在延續上篇文章,從第五點開始後修改即可,前面都一樣 訓練過程,比較圖 是不是CNN的效果比MLP還要好,
Thumbnail
本文將延續上一篇文章,經由訓練好的VAE模型其中的解碼器,來生成圖片。 [深度學習]訓練VAE模型用於生成圖片_訓練篇 輸入產生的隨機雜訊,輸入VAE的解碼器後,生成的圖片
Thumbnail
本文將延續上一篇文章,經由訓練好的VAE模型其中的解碼器,來生成圖片。 [深度學習]訓練VAE模型用於生成圖片_訓練篇 輸入產生的隨機雜訊,輸入VAE的解碼器後,生成的圖片
Thumbnail
本篇文章專注於消息傳遞(message passing)在圖神經網絡(GNN)中的應用,並以簡單的例子解釋了消息傳遞的過程和機制。
Thumbnail
本篇文章專注於消息傳遞(message passing)在圖神經網絡(GNN)中的應用,並以簡單的例子解釋了消息傳遞的過程和機制。
Thumbnail
GNN發展背景 傳統的深度學習模型如在計算機視覺(CV)和自然語言處理(NLP)領域中極為成功,主要是處理結構化數據如影像和文本。這些數據類型通常具有固定且規律的結構,例如影像是由有序的像素點組成。然而,在真實世界中,許多數據是非結構化的,如化合物結構(原子和分子)。這些數據雖然具有一定的規則性,
Thumbnail
GNN發展背景 傳統的深度學習模型如在計算機視覺(CV)和自然語言處理(NLP)領域中極為成功,主要是處理結構化數據如影像和文本。這些數據類型通常具有固定且規律的結構,例如影像是由有序的像素點組成。然而,在真實世界中,許多數據是非結構化的,如化合物結構(原子和分子)。這些數據雖然具有一定的規則性,
Thumbnail
本文主要介紹神經網路訓練辨識的過程,利用fashion_mnist及簡單的神經網路來進行分類。 使用只有兩層的神經網路來訓練辨識fashion_mnist資料。
Thumbnail
本文主要介紹神經網路訓練辨識的過程,利用fashion_mnist及簡單的神經網路來進行分類。 使用只有兩層的神經網路來訓練辨識fashion_mnist資料。
Thumbnail
卷積神經網路(CNN)是一種專門用於影像相關應用的神經網路。本文介紹了CNN在影像辨識中的應用,包括圖片的組成、Receptive Field、Parameter Sharing、以及Pooling等技術。通過本文,讀者將瞭解CNN在影像辨識領域的優勢和運作原理。
Thumbnail
卷積神經網路(CNN)是一種專門用於影像相關應用的神經網路。本文介紹了CNN在影像辨識中的應用,包括圖片的組成、Receptive Field、Parameter Sharing、以及Pooling等技術。通過本文,讀者將瞭解CNN在影像辨識領域的優勢和運作原理。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News