CNN 的訓練過程：AI 如何從「菜鳥」變成「專家」

Hank吳

2025/07/17 更新2025/07/17 發佈閱讀 5 分鐘

想像一下，訓練一個 CNN 就像教一個小小孩辨識貓咪和狗狗。一開始，小小孩可能分不清，但我們不斷地給他看貓咪和狗狗的照片，並告訴他正確答案，他就會慢慢學會。

CNN 的訓練也是類似的過程，主要有以下幾個步驟：

1. 準備大量的「訓練資料」

* 比喻：就像我們要教小小孩辨識貓狗，要先準備一大堆有標籤的貓咪和狗狗照片。

* 實際運作：我們會準備一個大型數據集 (Dataset)，裡面包含成千上萬張圖片，而且每張圖片都已經被人工標註好它屬於哪一類（例如：這張是「貓」，那張是「狗」，這張是「汽車」等等）。這些標籤就是 CNN 學習的「正確答案」。

2. 前向傳播 (Forward Propagation)：先猜猜看！

* 比喻：小小孩第一次看到一張照片，他會「猜猜看」這是貓還是狗。

* 實際運作：我們把一張訓練圖片輸入到 CNN 中。這張圖片會一層一層地通過卷積層、池化層和全連接層。最後，CNN 會給出一個「預測結果」，例如它可能預測這張圖片是貓的機率是 70%，狗的機率是 20%，汽車的機率是 10%。

3. 計算損失 (Calculate Loss)：猜錯了多少？

* 比喻：小小孩猜完後，大人會告訴他：「你猜錯了！」或者「你猜對了，但還可以更肯定一點。」

* 實際運作： CNN 預測的結果，會和這張圖片的真實標籤 (Ground Truth) 進行比較。我們用一個叫做**「損失函數」(Loss Function)** 的數學公式，來計算 CNN 這次「猜錯了多少」或者說「預測結果和真實答案的差距有多大」。

* 目標：訓練的目標就是讓這個「損失值」越小越好，代表 CNN 預測得越準確。

4. 反向傳播 (Backpropagation) 與最佳化 (Optimization)：修正錯誤，學習成長！

* 比喻：小小孩猜錯了，大人會解釋哪裡不對，小小孩下次就會調整自己的判斷方式。

* 實際運作：這是 CNN 學習最關鍵的一步。

* 首先，系統會根據剛才計算出的「損失值」，反向傳播回 CNN 的每一層。這個過程就像是把錯誤的訊息從輸出的最後一層，一路傳回輸入的第一層。

* 在反向傳播的過程中，CNN 會去調整它內部所有的「參數」(Parameters)，主要是卷積核（濾鏡）裡面的數值，以及全連接層中的權重和偏差值。

* 調整這些參數的目的是為了讓下次再遇到類似的圖片時，預測結果會更接近真實答案。這個調整參數的過程稱為**「最佳化」，常用的方法有梯度下降法 (Gradient Descent) 及其變種。

5. 循環迭代 (Iteration)：反覆練習，熟能生巧。

* 比喻：小小孩不是看一張照片就學會了，他需要看幾百張、幾千張照片，並不斷地被糾正錯誤，才能真正掌握。

* 實際運作：上述步驟 2 到 4 會不斷重複進行。我們會把所有的訓練圖片一張一張（或者一小批一小批）地餵給 CNN，然後不斷地計算損失、調整參數。這個過程會持續進行很多很多次，直到 CNN 的預測準確率達到一個滿意的程度，或者損失值不再顯著下降為止。

訓練過程中的關鍵要素

* 大量的數據：數據量越大，CNN 學習到的模式就越豐富，表現也會越好。

* 計算資源：訓練大型 CNN 模型需要強大的 GPU（圖形處理器）來加速運算。

* 模型架構： CNN 的層次多寡、每一層的濾鏡數量和大小等都會影響訓練效果。

* 超參數 (Hyperparameters)：訓練過程中需要人工設定的一些參數，例如學習率 (Learning Rate，決定每次調整參數的幅度)、批次大小 (Batch Size，每次訓練使用的圖片數量) 等，這些參數的選擇對訓練結果影響很大。

透過這樣反覆的「猜測－評估－修正」的過程，CNN 就像一個不知疲倦的學生，從大量的數據中自動學習並提取出圖片的複雜特徵，最終成為一個在影像辨識領域的「專家」。

#機器學習

#CNN

#模型

留言

留言分享你的想法！

Hank吳的沙龍

1會員

95內容數

這不僅僅是一個 Blog，更是一個交流與分享的空間。期待在這裡與你相遇，一起探索科技、體驗生活、夢想旅行！💖

Hank吳的沙龍的其他內容

2025/07/17

卷積神經網路 (CNN) 完整解析：原理、應用與優點

卷積神經網路（CNN）是一種專門用於處理影像的 AI 模型，其運作方式類似於人類大腦觀察圖像的方式，層層分析提取特徵。主要包含卷積層、池化層和全連接層。卷積層使用濾鏡提取局部特徵；池化層精簡數據並提升模型穩健性；全連接層進行最終分類。CNN 廣泛應用於影像辨識、自動駕駛和醫療影像分析等領域。

2025/07/17

卷積神經網路 (CNN) 完整解析：原理、應用與優點

2025/07/17

「親手訓練」一個專屬於你的影像辨識模型

Google 推出的 Teachable Machine 讓使用者能輕鬆體驗 AI 訓練過程。此教學文章說明如何訓練一個能辨識「讚」和「OK」手勢的 AI 模型，步驟包含建立分類、餵食 AI 範例圖片、訓練模型以及測試預覽。

2025/07/17

「親手訓練」一個專屬於你的影像辨識模型

2025/07/17

電腦如何「看」懂圖片？淺談影像辨識技術

影像辨識技術如何運作？本文以樂高積木為例，深入淺出地解釋電腦如何從像素數據中學習並辨識圖像，並列舉生活中影像辨識的應用實例，例如人臉解鎖、車牌辨識、醫療影像分析和自動駕駛等。

2025/07/17

電腦如何「看」懂圖片？淺談影像辨識技術

看更多

你可能也想看

創業經驗談

出國旅遊穿搭攻略｜WIWI 輕旅穿搭首選 × 蝦皮雙11活動限時優惠，保暖、防曬一次搞定！

每次出國旅行，最讓人頭痛的就是要穿什麼？不同國家的氣候差很大，從零下低溫到艷陽高照，一趟旅程可能要準備兩季的衣服！這次我整理出我出國最愛帶的 WIWI 輕旅穿搭清單，全部都能在蝦皮雙11活動期間用超優惠價格入手，還能同時參加蝦皮分潤計畫，一邊分享一邊賺旅費 💰 雙11優惠懶人包：

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

創業經驗談

出國旅遊穿搭攻略｜WIWI 輕旅穿搭首選 × 蝦皮雙11活動限時優惠，保暖、防曬一次搞定！

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

成長痛WDKY的沙龍

POK萬能磁吸腳架心得分享，蝦皮買的手機腳架不專業開箱分享

大家好久不見，趁著連假有時間寫文來分享我這陣子的近況～大約 8 月中後的時候，我自己去了一小趟的釜山+福岡獨旅，主要是因為想讓自己沈澱放鬆，也加上自己好久沒有好好休息，所以希望可以有一段自己的時間。當然，也因為這次是獨自出發，所以身為小小自媒體工作者還是會需要拍照記錄一下生活，所以這次旅程還

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/06

成長痛WDKY的沙龍

POK萬能磁吸腳架心得分享，蝦皮買的手機腳架不專業開箱分享

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/06

夜晚探索的沙龍

AI生成的貓貓故事

這是一篇介紹如何使用AI來生成貓貓圖片的文章，作者透過幾個軟體的使用經驗，分享了AI生成圖片的效果以及注意事項。文章內容豐富，並且有各種關鍵字和描述，可以吸引潛在讀者。

2024/07/30

2024/07/30

[深度學習][Python]利用訓練完成的GAN模型來生成圖片_生成篇

本文將延續上一篇文章，經由訓練好的GAN模型中的生成器來生成圖片 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 [深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇相較之下CNN的GAN生成的效果比較好，但模型也相對比較複雜，訓練時間花的也比較

#GAN生成圖片#生成器生成圖片#VAE

2024/07/26

螃蟹_crab的沙龍

[深度學習][Python]利用訓練完成的GAN模型來生成圖片_生成篇

#GAN生成圖片#生成器生成圖片#VAE

2024/07/26

螃蟹_crab的沙龍

[深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇

延續上一篇訓練GAM模型，這次我們讓神經網路更多層更複雜一點，來看訓練生成的圖片是否效果會更好。 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇資料集分割處理的部分在延續上篇文章，從第五點開始後修改即可，前面都一樣訓練過程，比較圖是不是CNN的效果比MLP還要好，

#CNN的GAN模型#Python#深度學習

2024/07/26

螃蟹_crab的沙龍

[深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇

#CNN的GAN模型#Python#深度學習

2024/07/26

柴郡貓姍蒂的沙龍

筆記-深度學習模型訓練：利用殘差網路做影像辨識

前言讀了許多理論，是時候實際動手做做看了，以下是我的模型訓練初體驗，有點糟就是了XD。正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,

#深度學習#AI#人工智慧

2024/07/23

柴郡貓姍蒂的沙龍

筆記-深度學習模型訓練：利用殘差網路做影像辨識

#深度學習#AI#人工智慧

2024/07/23

Will 進步本

拐點 #003: GPT 的名稱怎麼來的

在機器學習領域中，監督學習、無監督學習和強化學習是三種核心方法，它們在解決不同類型的問題時發揮著重要作用。

2024/05/12

Will 進步本

拐點 #003: GPT 的名稱怎麼來的

在機器學習領域中，監督學習、無監督學習和強化學習是三種核心方法，它們在解決不同類型的問題時發揮著重要作用。

2024/05/12

每日發車

筆記-曲博談AI模型.群聯-24.05.05

筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型三個步驟: 1.預訓練，訓練一次要用幾萬顆處理器、訓練時間要1個月，ChatGPT訓練一次的成本為1000萬美金。 2.微調(

2024/05/06

每日發車

筆記-曲博談AI模型.群聯-24.05.05

2024/05/06

dab戴伯的沙龍

卷積神經網路(CNN)在影像辨識中的應用

卷積神經網路（CNN）是一種專門用於影像相關應用的神經網路。本文介紹了CNN在影像辨識中的應用，包括圖片的組成、Receptive Field、Parameter Sharing、以及Pooling等技術。通過本文，讀者將瞭解CNN在影像辨識領域的優勢和運作原理。

2024/05/02

2024/05/02

[機器學習]CNN學習MNIST 手寫英文字母資料，用網頁展現成果_Streamlit Web應用程式篇

前言上一篇討論到如何訓練出模型，此篇將說明Streamlit建立的簡單Web應用程式的解說 Streamlit網頁App_貓狗辨識連結程式碼Github連結 [機器學習]CNN學習MNIST 手寫英文字母資料，用網頁展現成果_模型訓練篇如何連動github與stramlit可以參考

#網頁#Streamlit#python

2024/01/06

螃蟹_crab的沙龍

[機器學習]CNN學習MNIST 手寫英文字母資料，用網頁展現成果_Streamlit Web應用程式篇

#網頁#Streamlit#python

2024/01/06

螃蟹_crab的沙龍

[機器學習]CNN學習MNIST 手寫英文字母資料，用網頁展現成果_模型訓練篇

streamlit與github連動程式庫，呈現即時預測手寫英文字母整理了一下，先前學的機器學習利用Colab來訓練出能辨識手寫A~Z英文字母的模型，使用的模型是CNN(Convolutional Neural Network，CNN）模型訓練好的模型，當然是要拿來應用，成果呈現

#機器學習#CNN模型#手寫辨識

2024/01/06

螃蟹_crab的沙龍

[機器學習]CNN學習MNIST 手寫英文字母資料，用網頁展現成果_模型訓練篇

#機器學習#CNN模型#手寫辨識

2024/01/06

吉米富的沙龍

CNN實作Kaggle貓狗影像辨識(Pytorch)

最近剛好修了Pytorch相關的課，在Kaggle上也丟了個比賽，想說就來分享一下Pytorch的入門實戰，我會實作一個最入門的用CNN辨識貓狗的程式，但關於CNN理論的部分我不會提到太多，有興趣就麻煩再去搜尋了~ CNN是什麼? 先簡單介紹一下CNN，CNN的全名是(Convolutional N

#Pytorch#Kaggle#CNN

2020/04/23

吉米富的沙龍

CNN實作Kaggle貓狗影像辨識(Pytorch)

#Pytorch#Kaggle#CNN

2020/04/23

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News