AI如何看懂圖片?CNN卷積神經網路解剖

更新 發佈閱讀 1 分鐘

你有沒有想過,AI 是怎麼看懂圖片的呢?例如,我們給 AI 一張小狗的照片,它是怎麼判斷這是一隻狗,而不是貓或其他動物?答案就在 CNN(卷積神經網路,Convolutional Neural Network) 這項技術!CNN 就像 AI 的「視覺大腦」,能夠一步步分析圖片,最終得出正確的判斷。這篇文章就用一張小狗的圖片,來看看 CNN 如何「看懂世界」!

🔹 CNN 的 4 個關鍵步驟

CNN 透過 4 個步驟 來處理圖片,每一步都像是在「畫畫」或「縮小圖片」來幫助 AI 更容易理解影像內容。

1️⃣ 卷積層(Convolution Layer):這一層的作用是讓AI找出圖片中的關鍵特徵,例如邊緣、顏色及形狀等。

📌 可以想像這像是 畫家在畫素描,先用鉛筆勾勒出輪廓,確保 AI 能抓住圖片中最重要的部分。

raw-image

2️⃣ 池化層(Pooling Layer):這一層的作用是減少圖片的大小,但保留最重要的資訊。縮小圖片,保留關鍵資訊,例如如果背景有數或草地,在這一層就會自動忽略這些不重要的細節,只專注「小狗」本身的特徵。

📌 這就像我們拍照後縮小圖片,但還能看得出這是一隻狗。

raw-image

3️⃣ 全連接層(Fully Connected Layer):在這一層會計算這張圖片像貓的機率為多少?例如10%,像馬的機率,例如5%,像小狗的機率,例如85%,因為小狗的分數最高,所以AI會選擇這個答案

📌 如果前兩層是「畫畫」,這一層就像是在「考試」,AI 要根據學過的知識,決定這張圖像的正確分類。

raw-image

4️⃣ 輸出結果:這是一隻「小狗」!

📌 最這就像是考試完後,老師批改成績,標註「這是小狗」並打上✅。

raw-image

CNN 讓 AI 能夠看懂世界,就像我們用眼睛辨識物體一樣!所以,當你在手機上看到「自動分類相片」,或是「AI 自動辨識貓狗」,這些功能背後都是 CNN 在發揮作用的唷!^^

留言
avatar-img
靈感補給站|隨筆 × 商業 × 創作
3會員
92內容數
📖 財會背景|內部稽核師(CIA)/ERP軟體應用師 上班靠邏輯,下班靠靈感。 寫吃的、寫日常,也寫世界的眉角。 ✨
2025/04/29
當我們說 AI「會看圖」,其實是在講「電腦視覺(Computer Vision)」。 它靠 CNN 來辨認圖像細節,再用像 YOLO 這樣的模型標記圖中的物件位置。 簡單說,CV 是任務、CNN 是工具、YOLO 是應用。 從看得懂,到抓得準,這就是 AI 看圖的完整流程。
Thumbnail
2025/04/29
當我們說 AI「會看圖」,其實是在講「電腦視覺(Computer Vision)」。 它靠 CNN 來辨認圖像細節,再用像 YOLO 這樣的模型標記圖中的物件位置。 簡單說,CV 是任務、CNN 是工具、YOLO 是應用。 從看得懂,到抓得準,這就是 AI 看圖的完整流程。
Thumbnail
2025/04/27
LSTM 是記憶力加強版的 RNN,能判斷哪些資訊該記、哪些該忘,特別適合處理語音、文字、股市等時間序列資料。它透過記憶門控機制,解決了 RNN 容易忘記前面訊息的缺點,是 AI 世界裡的「聰明筆記王」。
Thumbnail
2025/04/27
LSTM 是記憶力加強版的 RNN,能判斷哪些資訊該記、哪些該忘,特別適合處理語音、文字、股市等時間序列資料。它透過記憶門控機制,解決了 RNN 容易忘記前面訊息的缺點,是 AI 世界裡的「聰明筆記王」。
Thumbnail
2025/04/24
會不會下 Prompt,決定你能不能讓 AI 幫上忙。Prompt 工程是一種讓 AI「聽得懂人話」的關鍵技術,只要你問得夠清楚,它就能回得又快又準。這篇用白話說明什麼是 Prompt、怎麼設計,讓你從亂問亂回,進化成懂問會用的 AI 控制者。
Thumbnail
2025/04/24
會不會下 Prompt,決定你能不能讓 AI 幫上忙。Prompt 工程是一種讓 AI「聽得懂人話」的關鍵技術,只要你問得夠清楚,它就能回得又快又準。這篇用白話說明什麼是 Prompt、怎麼設計,讓你從亂問亂回,進化成懂問會用的 AI 控制者。
Thumbnail
看更多
你可能也想看
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
這是一篇介紹如何使用AI來生成貓貓圖片的文章,作者透過幾個軟體的使用經驗,分享了AI生成圖片的效果以及注意事項。文章內容豐富,並且有各種關鍵字和描述,可以吸引潛在讀者。
Thumbnail
這是一篇介紹如何使用AI來生成貓貓圖片的文章,作者透過幾個軟體的使用經驗,分享了AI生成圖片的效果以及注意事項。文章內容豐富,並且有各種關鍵字和描述,可以吸引潛在讀者。
Thumbnail
本文將延續上一篇文章,經由訓練好的GAN模型中的生成器來生成圖片 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 [深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇 相較之下CNN的GAN生成的效果比較好,但模型也相對比較複雜,訓練時間花的也比較
Thumbnail
本文將延續上一篇文章,經由訓練好的GAN模型中的生成器來生成圖片 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 [深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇 相較之下CNN的GAN生成的效果比較好,但模型也相對比較複雜,訓練時間花的也比較
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
什麼是 AI? Artificial Intellgent ㄧ個數位大腦 電腦新物種 模擬人類的腦神經 整合2D與3D的繪圖視覺 在Bing 裡面基本上分為這幾個類型: 逼真的3D動畫 動畫虛擬人偶 展示攝影 可愛貼圖 二為圖例 電腦科幻虛擬人偶 公司標誌 卡通電影海
Thumbnail
什麼是 AI? Artificial Intellgent ㄧ個數位大腦 電腦新物種 模擬人類的腦神經 整合2D與3D的繪圖視覺 在Bing 裡面基本上分為這幾個類型: 逼真的3D動畫 動畫虛擬人偶 展示攝影 可愛貼圖 二為圖例 電腦科幻虛擬人偶 公司標誌 卡通電影海
Thumbnail
AI,全稱人工智慧,是指讓電腦或機器具備類似人類的智慧和能力的科學和技術。AI 可以幫助我們解決各種問題,提高效率,創造價值,甚至改變世界。但是,你知道 AI 是如何運作的嗎?你知道 AI 的歷史和未來嗎?你知道 AI 的優點和挑戰嗎?在這篇文章中,我將帶你一起認識 AI 的基本概念和發展。
Thumbnail
AI,全稱人工智慧,是指讓電腦或機器具備類似人類的智慧和能力的科學和技術。AI 可以幫助我們解決各種問題,提高效率,創造價值,甚至改變世界。但是,你知道 AI 是如何運作的嗎?你知道 AI 的歷史和未來嗎?你知道 AI 的優點和挑戰嗎?在這篇文章中,我將帶你一起認識 AI 的基本概念和發展。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
Thumbnail
前言 上一篇討論到如何訓練出模型,此篇將說明Streamlit建立的簡單Web應用程式的解說 Streamlit網頁App_貓狗辨識 連結 程式碼Github連結 [機器學習]CNN學習MNIST 手寫英文字母資料,用網頁展現成果_模型訓練篇 如何連動github與stramlit可以參考
Thumbnail
前言 上一篇討論到如何訓練出模型,此篇將說明Streamlit建立的簡單Web應用程式的解說 Streamlit網頁App_貓狗辨識 連結 程式碼Github連結 [機器學習]CNN學習MNIST 手寫英文字母資料,用網頁展現成果_模型訓練篇 如何連動github與stramlit可以參考
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News