CNN 的訓練過程:AI 如何從「菜鳥」變成「專家」

更新 發佈閱讀 5 分鐘

想像一下,訓練一個 CNN 就像教一個小小孩辨識貓咪和狗狗。一開始,小小孩可能分不清,但我們不斷地給他看貓咪和狗狗的照片,並告訴他正確答案,他就會慢慢學會。

CNN 的訓練也是類似的過程,主要有以下幾個步驟:

1. 準備大量的「訓練資料」

* 比喻: 就像我們要教小小孩辨識貓狗,要先準備一大堆有標籤的貓咪和狗狗照片。

* 實際運作: 我們會準備一個大型數據集 (Dataset),裡面包含成千上萬張圖片,而且每張圖片都已經被人工標註好它屬於哪一類(例如:這張是「貓」,那張是「狗」,這張是「汽車」等等)。這些標籤就是 CNN 學習的「正確答案」。

2. 前向傳播 (Forward Propagation):先猜猜看!

* 比喻: 小小孩第一次看到一張照片,他會「猜猜看」這是貓還是狗。

* 實際運作: 我們把一張訓練圖片輸入到 CNN 中。這張圖片會一層一層地通過卷積層、池化層和全連接層。最後,CNN 會給出一個「預測結果」,例如它可能預測這張圖片是貓的機率是 70%,狗的機率是 20%,汽車的機率是 10%。

3. 計算損失 (Calculate Loss):猜錯了多少?

* 比喻: 小小孩猜完後,大人會告訴他:「你猜錯了!」或者「你猜對了,但還可以更肯定一點。」

* 實際運作: CNN 預測的結果,會和這張圖片的真實標籤 (Ground Truth) 進行比較。我們用一個叫做**「損失函數」(Loss Function)** 的數學公式,來計算 CNN 這次「猜錯了多少」或者說「預測結果和真實答案的差距有多大」。

* 目標: 訓練的目標就是讓這個「損失值」越小越好,代表 CNN 預測得越準確。

4. 反向傳播 (Backpropagation) 與 最佳化 (Optimization):修正錯誤,學習成長!

* 比喻: 小小孩猜錯了,大人會解釋哪裡不對,小小孩下次就會調整自己的判斷方式。

* 實際運作: 這是 CNN 學習最關鍵的一步。

* 首先,系統會根據剛才計算出的「損失值」,反向傳播回 CNN 的每一層。這個過程就像是把錯誤的訊息從輸出的最後一層,一路傳回輸入的第一層。

* 在反向傳播的過程中,CNN 會去調整它內部所有的「參數」(Parameters),主要是卷積核(濾鏡)裡面的數值,以及全連接層中的權重和偏差值。

* 調整這些參數的目的是為了讓下次再遇到類似的圖片時,預測結果會更接近真實答案。這個調整參數的過程稱為**「最佳化」,常用的方法有梯度下降法 (Gradient Descent) 及其變種。

5. 循環迭代 (Iteration):反覆練習,熟能生巧。

* 比喻: 小小孩不是看一張照片就學會了,他需要看幾百張、幾千張照片,並不斷地被糾正錯誤,才能真正掌握。

* 實際運作: 上述步驟 2 到 4 會不斷重複進行。我們會把所有的訓練圖片一張一張(或者一小批一小批)地餵給 CNN,然後不斷地計算損失、調整參數。這個過程會持續進行很多很多次,直到 CNN 的預測準確率達到一個滿意的程度,或者損失值不再顯著下降為止。

訓練過程中的關鍵要素

* 大量的數據: 數據量越大,CNN 學習到的模式就越豐富,表現也會越好。

* 計算資源: 訓練大型 CNN 模型需要強大的 GPU(圖形處理器)來加速運算。

* 模型架構: CNN 的層次多寡、每一層的濾鏡數量和大小等都會影響訓練效果。

* 超參數 (Hyperparameters): 訓練過程中需要人工設定的一些參數,例如學習率 (Learning Rate,決定每次調整參數的幅度)、批次大小 (Batch Size,每次訓練使用的圖片數量) 等,這些參數的選擇對訓練結果影響很大。

透過這樣反覆的「猜測-評估-修正」的過程,CNN 就像一個不知疲倦的學生,從大量的數據中自動學習並提取出圖片的複雜特徵,最終成為一個在影像辨識領域的「專家」。


留言
avatar-img
留言分享你的想法!
avatar-img
Hank吳的沙龍
1會員
95內容數
這不僅僅是一個 Blog,更是一個交流與分享的空間。 期待在這裡與你相遇,一起探索科技、體驗生活、夢想旅行!💖
Hank吳的沙龍的其他內容
2025/07/17
卷積神經網路(CNN)是一種專門用於處理影像的 AI 模型,其運作方式類似於人類大腦觀察圖像的方式,層層分析提取特徵。主要包含卷積層、池化層和全連接層。卷積層使用濾鏡提取局部特徵;池化層精簡數據並提升模型穩健性;全連接層進行最終分類。CNN 廣泛應用於影像辨識、自動駕駛和醫療影像分析等領域。
Thumbnail
2025/07/17
卷積神經網路(CNN)是一種專門用於處理影像的 AI 模型,其運作方式類似於人類大腦觀察圖像的方式,層層分析提取特徵。主要包含卷積層、池化層和全連接層。卷積層使用濾鏡提取局部特徵;池化層精簡數據並提升模型穩健性;全連接層進行最終分類。CNN 廣泛應用於影像辨識、自動駕駛和醫療影像分析等領域。
Thumbnail
2025/07/17
Google 推出的 Teachable Machine 讓使用者能輕鬆體驗 AI 訓練過程。此教學文章說明如何訓練一個能辨識「讚」和「OK」手勢的 AI 模型,步驟包含建立分類、餵食 AI 範例圖片、訓練模型以及測試預覽。
Thumbnail
2025/07/17
Google 推出的 Teachable Machine 讓使用者能輕鬆體驗 AI 訓練過程。此教學文章說明如何訓練一個能辨識「讚」和「OK」手勢的 AI 模型,步驟包含建立分類、餵食 AI 範例圖片、訓練模型以及測試預覽。
Thumbnail
2025/07/17
影像辨識技術如何運作?本文以樂高積木為例,深入淺出地解釋電腦如何從像素數據中學習並辨識圖像,並列舉生活中影像辨識的應用實例,例如人臉解鎖、車牌辨識、醫療影像分析和自動駕駛等。
Thumbnail
2025/07/17
影像辨識技術如何運作?本文以樂高積木為例,深入淺出地解釋電腦如何從像素數據中學習並辨識圖像,並列舉生活中影像辨識的應用實例,例如人臉解鎖、車牌辨識、醫療影像分析和自動駕駛等。
Thumbnail
看更多
你可能也想看
Thumbnail
每次出國旅行,最讓人頭痛的就是要穿什麼? 不同國家的氣候差很大,從零下低溫到艷陽高照,一趟旅程可能要準備兩季的衣服! 這次我整理出我出國最愛帶的 WIWI 輕旅穿搭清單,全部都能在 蝦皮雙11活動 期間用超優惠價格入手,還能同時參加 蝦皮分潤計畫,一邊分享一邊賺旅費 💰 雙11優惠懶人包:
Thumbnail
每次出國旅行,最讓人頭痛的就是要穿什麼? 不同國家的氣候差很大,從零下低溫到艷陽高照,一趟旅程可能要準備兩季的衣服! 這次我整理出我出國最愛帶的 WIWI 輕旅穿搭清單,全部都能在 蝦皮雙11活動 期間用超優惠價格入手,還能同時參加 蝦皮分潤計畫,一邊分享一邊賺旅費 💰 雙11優惠懶人包:
Thumbnail
大家好久不見,趁著連假有時間寫文來分享我這陣子的近況~ 大約 8 月中後的時候,我自己去了一小趟的釜山+福岡獨旅,主要是因為想讓自己沈澱放鬆,也加上自己好久沒有好好休息,所以希望可以有一段自己的時間。 當然,也因為這次是獨自出發,所以身為小小自媒體工作者還是會需要拍照記錄一下生活,所以這次旅程還
Thumbnail
大家好久不見,趁著連假有時間寫文來分享我這陣子的近況~ 大約 8 月中後的時候,我自己去了一小趟的釜山+福岡獨旅,主要是因為想讓自己沈澱放鬆,也加上自己好久沒有好好休息,所以希望可以有一段自己的時間。 當然,也因為這次是獨自出發,所以身為小小自媒體工作者還是會需要拍照記錄一下生活,所以這次旅程還
Thumbnail
這是一篇介紹如何使用AI來生成貓貓圖片的文章,作者透過幾個軟體的使用經驗,分享了AI生成圖片的效果以及注意事項。文章內容豐富,並且有各種關鍵字和描述,可以吸引潛在讀者。
Thumbnail
這是一篇介紹如何使用AI來生成貓貓圖片的文章,作者透過幾個軟體的使用經驗,分享了AI生成圖片的效果以及注意事項。文章內容豐富,並且有各種關鍵字和描述,可以吸引潛在讀者。
Thumbnail
本文將延續上一篇文章,經由訓練好的GAN模型中的生成器來生成圖片 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 [深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇 相較之下CNN的GAN生成的效果比較好,但模型也相對比較複雜,訓練時間花的也比較
Thumbnail
本文將延續上一篇文章,經由訓練好的GAN模型中的生成器來生成圖片 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 [深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇 相較之下CNN的GAN生成的效果比較好,但模型也相對比較複雜,訓練時間花的也比較
Thumbnail
延續上一篇訓練GAM模型,這次我們讓神經網路更多層更複雜一點,來看訓練生成的圖片是否效果會更好。 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 資料集分割處理的部分在延續上篇文章,從第五點開始後修改即可,前面都一樣 訓練過程,比較圖 是不是CNN的效果比MLP還要好,
Thumbnail
延續上一篇訓練GAM模型,這次我們讓神經網路更多層更複雜一點,來看訓練生成的圖片是否效果會更好。 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 資料集分割處理的部分在延續上篇文章,從第五點開始後修改即可,前面都一樣 訓練過程,比較圖 是不是CNN的效果比MLP還要好,
Thumbnail
前言 讀了許多理論,是時候實際動手做做看了,以下是我的模型訓練初體驗,有點糟就是了XD。 正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,
Thumbnail
前言 讀了許多理論,是時候實際動手做做看了,以下是我的模型訓練初體驗,有點糟就是了XD。 正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
卷積神經網路(CNN)是一種專門用於影像相關應用的神經網路。本文介紹了CNN在影像辨識中的應用,包括圖片的組成、Receptive Field、Parameter Sharing、以及Pooling等技術。通過本文,讀者將瞭解CNN在影像辨識領域的優勢和運作原理。
Thumbnail
卷積神經網路(CNN)是一種專門用於影像相關應用的神經網路。本文介紹了CNN在影像辨識中的應用,包括圖片的組成、Receptive Field、Parameter Sharing、以及Pooling等技術。通過本文,讀者將瞭解CNN在影像辨識領域的優勢和運作原理。
Thumbnail
前言 上一篇討論到如何訓練出模型,此篇將說明Streamlit建立的簡單Web應用程式的解說 Streamlit網頁App_貓狗辨識 連結 程式碼Github連結 [機器學習]CNN學習MNIST 手寫英文字母資料,用網頁展現成果_模型訓練篇 如何連動github與stramlit可以參考
Thumbnail
前言 上一篇討論到如何訓練出模型,此篇將說明Streamlit建立的簡單Web應用程式的解說 Streamlit網頁App_貓狗辨識 連結 程式碼Github連結 [機器學習]CNN學習MNIST 手寫英文字母資料,用網頁展現成果_模型訓練篇 如何連動github與stramlit可以參考
Thumbnail
streamlit與github連動程式庫,呈現即時預測手寫英文字母 整理了一下,先前學的機器學習利用Colab來訓練出能辨識手寫A~Z英文字母的模型,使用的模型是CNN(Convolutional Neural Network,CNN)模型 訓練好的模型,當然是要拿來應用,成果呈現
Thumbnail
streamlit與github連動程式庫,呈現即時預測手寫英文字母 整理了一下,先前學的機器學習利用Colab來訓練出能辨識手寫A~Z英文字母的模型,使用的模型是CNN(Convolutional Neural Network,CNN)模型 訓練好的模型,當然是要拿來應用,成果呈現
Thumbnail
最近剛好修了Pytorch相關的課,在Kaggle上也丟了個比賽,想說就來分享一下Pytorch的入門實戰,我會實作一個最入門的用CNN辨識貓狗的程式,但關於CNN理論的部分我不會提到太多,有興趣就麻煩再去搜尋了~ CNN是什麼? 先簡單介紹一下CNN,CNN的全名是(Convolutional N
Thumbnail
最近剛好修了Pytorch相關的課,在Kaggle上也丟了個比賽,想說就來分享一下Pytorch的入門實戰,我會實作一個最入門的用CNN辨識貓狗的程式,但關於CNN理論的部分我不會提到太多,有興趣就麻煩再去搜尋了~ CNN是什麼? 先簡單介紹一下CNN,CNN的全名是(Convolutional N
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News