AI如何看懂圖片?CNN卷積神經網路解剖

更新於 發佈於 閱讀時間約 1 分鐘

你有沒有想過,AI 是怎麼看懂圖片的呢?例如,我們給 AI 一張小狗的照片,它是怎麼判斷這是一隻狗,而不是貓或其他動物?答案就在 CNN(卷積神經網路,Convolutional Neural Network) 這項技術!CNN 就像 AI 的「視覺大腦」,能夠一步步分析圖片,最終得出正確的判斷。這篇文章就用一張小狗的圖片,來看看 CNN 如何「看懂世界」!

🔹 CNN 的 4 個關鍵步驟

CNN 透過 4 個步驟 來處理圖片,每一步都像是在「畫畫」或「縮小圖片」來幫助 AI 更容易理解影像內容。

1️⃣ 卷積層(Convolution Layer):這一層的作用是讓AI找出圖片中的關鍵特徵,例如邊緣、顏色及形狀等。

📌 可以想像這像是 畫家在畫素描,先用鉛筆勾勒出輪廓,確保 AI 能抓住圖片中最重要的部分。

raw-image

2️⃣ 池化層(Pooling Layer):這一層的作用是減少圖片的大小,但保留最重要的資訊。縮小圖片,保留關鍵資訊,例如如果背景有數或草地,在這一層就會自動忽略這些不重要的細節,只專注「小狗」本身的特徵。

📌 這就像我們拍照後縮小圖片,但還能看得出這是一隻狗。

raw-image

3️⃣ 全連接層(Fully Connected Layer):在這一層會計算這張圖片像貓的機率為多少?例如10%,像馬的機率,例如5%,像小狗的機率,例如85%,因為小狗的分數最高,所以AI會選擇這個答案

📌 如果前兩層是「畫畫」,這一層就像是在「考試」,AI 要根據學過的知識,決定這張圖像的正確分類。

raw-image

4️⃣ 輸出結果:這是一隻「小狗」!

📌 最這就像是考試完後,老師批改成績,標註「這是小狗」並打上✅。

raw-image

CNN 讓 AI 能夠看懂世界,就像我們用眼睛辨識物體一樣!所以,當你在手機上看到「自動分類相片」,或是「AI 自動辨識貓狗」,這些功能背後都是 CNN 在發揮作用的唷!^^

留言
avatar-img
留言分享你的想法!
avatar-img
靈感補給站|隨筆 × 商業 × 創作
1會員
92內容數
📖 財會背景|內部稽核師(CIA)/ERP軟體應用師 上班靠邏輯,下班靠靈感。 寫吃的、寫日常,也寫世界的眉角。 ✨
2025/04/29
當我們說 AI「會看圖」,其實是在講「電腦視覺(Computer Vision)」。 它靠 CNN 來辨認圖像細節,再用像 YOLO 這樣的模型標記圖中的物件位置。 簡單說,CV 是任務、CNN 是工具、YOLO 是應用。 從看得懂,到抓得準,這就是 AI 看圖的完整流程。
Thumbnail
2025/04/29
當我們說 AI「會看圖」,其實是在講「電腦視覺(Computer Vision)」。 它靠 CNN 來辨認圖像細節,再用像 YOLO 這樣的模型標記圖中的物件位置。 簡單說,CV 是任務、CNN 是工具、YOLO 是應用。 從看得懂,到抓得準,這就是 AI 看圖的完整流程。
Thumbnail
2025/04/27
LSTM 是記憶力加強版的 RNN,能判斷哪些資訊該記、哪些該忘,特別適合處理語音、文字、股市等時間序列資料。它透過記憶門控機制,解決了 RNN 容易忘記前面訊息的缺點,是 AI 世界裡的「聰明筆記王」。
Thumbnail
2025/04/27
LSTM 是記憶力加強版的 RNN,能判斷哪些資訊該記、哪些該忘,特別適合處理語音、文字、股市等時間序列資料。它透過記憶門控機制,解決了 RNN 容易忘記前面訊息的缺點,是 AI 世界裡的「聰明筆記王」。
Thumbnail
2025/04/24
會不會下 Prompt,決定你能不能讓 AI 幫上忙。Prompt 工程是一種讓 AI「聽得懂人話」的關鍵技術,只要你問得夠清楚,它就能回得又快又準。這篇用白話說明什麼是 Prompt、怎麼設計,讓你從亂問亂回,進化成懂問會用的 AI 控制者。
Thumbnail
2025/04/24
會不會下 Prompt,決定你能不能讓 AI 幫上忙。Prompt 工程是一種讓 AI「聽得懂人話」的關鍵技術,只要你問得夠清楚,它就能回得又快又準。這篇用白話說明什麼是 Prompt、怎麼設計,讓你從亂問亂回,進化成懂問會用的 AI 控制者。
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
這是一篇介紹如何使用AI來生成貓貓圖片的文章,作者透過幾個軟體的使用經驗,分享了AI生成圖片的效果以及注意事項。文章內容豐富,並且有各種關鍵字和描述,可以吸引潛在讀者。
Thumbnail
這是一篇介紹如何使用AI來生成貓貓圖片的文章,作者透過幾個軟體的使用經驗,分享了AI生成圖片的效果以及注意事項。文章內容豐富,並且有各種關鍵字和描述,可以吸引潛在讀者。
Thumbnail
本文將延續上一篇文章,經由訓練好的GAN模型中的生成器來生成圖片 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 [深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇 相較之下CNN的GAN生成的效果比較好,但模型也相對比較複雜,訓練時間花的也比較
Thumbnail
本文將延續上一篇文章,經由訓練好的GAN模型中的生成器來生成圖片 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 [深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇 相較之下CNN的GAN生成的效果比較好,但模型也相對比較複雜,訓練時間花的也比較
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
什麼是 AI? Artificial Intellgent ㄧ個數位大腦 電腦新物種 模擬人類的腦神經 整合2D與3D的繪圖視覺 在Bing 裡面基本上分為這幾個類型: 逼真的3D動畫 動畫虛擬人偶 展示攝影 可愛貼圖 二為圖例 電腦科幻虛擬人偶 公司標誌 卡通電影海
Thumbnail
什麼是 AI? Artificial Intellgent ㄧ個數位大腦 電腦新物種 模擬人類的腦神經 整合2D與3D的繪圖視覺 在Bing 裡面基本上分為這幾個類型: 逼真的3D動畫 動畫虛擬人偶 展示攝影 可愛貼圖 二為圖例 電腦科幻虛擬人偶 公司標誌 卡通電影海
Thumbnail
AI,全稱人工智慧,是指讓電腦或機器具備類似人類的智慧和能力的科學和技術。AI 可以幫助我們解決各種問題,提高效率,創造價值,甚至改變世界。但是,你知道 AI 是如何運作的嗎?你知道 AI 的歷史和未來嗎?你知道 AI 的優點和挑戰嗎?在這篇文章中,我將帶你一起認識 AI 的基本概念和發展。
Thumbnail
AI,全稱人工智慧,是指讓電腦或機器具備類似人類的智慧和能力的科學和技術。AI 可以幫助我們解決各種問題,提高效率,創造價值,甚至改變世界。但是,你知道 AI 是如何運作的嗎?你知道 AI 的歷史和未來嗎?你知道 AI 的優點和挑戰嗎?在這篇文章中,我將帶你一起認識 AI 的基本概念和發展。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
Thumbnail
前言 上一篇討論到如何訓練出模型,此篇將說明Streamlit建立的簡單Web應用程式的解說 Streamlit網頁App_貓狗辨識 連結 程式碼Github連結 [機器學習]CNN學習MNIST 手寫英文字母資料,用網頁展現成果_模型訓練篇 如何連動github與stramlit可以參考
Thumbnail
前言 上一篇討論到如何訓練出模型,此篇將說明Streamlit建立的簡單Web應用程式的解說 Streamlit網頁App_貓狗辨識 連結 程式碼Github連結 [機器學習]CNN學習MNIST 手寫英文字母資料,用網頁展現成果_模型訓練篇 如何連動github與stramlit可以參考
Thumbnail
streamlit與github連動程式庫,呈現即時預測手寫英文字母 整理了一下,先前學的機器學習利用Colab來訓練出能辨識手寫A~Z英文字母的模型,使用的模型是CNN(Convolutional Neural Network,CNN)模型 訓練好的模型,當然是要拿來應用,成果呈現
Thumbnail
streamlit與github連動程式庫,呈現即時預測手寫英文字母 整理了一下,先前學的機器學習利用Colab來訓練出能辨識手寫A~Z英文字母的模型,使用的模型是CNN(Convolutional Neural Network,CNN)模型 訓練好的模型,當然是要拿來應用,成果呈現
Thumbnail
這一篇來談談AI(這邊指的AI是神經網路) 到底怎麼學習畫圖的,究竟只會簡簡單單運算數字的電腦,只有簡單邏輯運算子的IC晶片到底是怎麼做到的? 本篇當然不會讓大家看長篇大論的神經網路的原理,而是用我理解這件事情的方法,講解各個各位聽聽AI繪圖的箇中道理。
Thumbnail
這一篇來談談AI(這邊指的AI是神經網路) 到底怎麼學習畫圖的,究竟只會簡簡單單運算數字的電腦,只有簡單邏輯運算子的IC晶片到底是怎麼做到的? 本篇當然不會讓大家看長篇大論的神經網路的原理,而是用我理解這件事情的方法,講解各個各位聽聽AI繪圖的箇中道理。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News