電腦如何「看」懂圖片？淺談影像辨識技術

Hank吳

2025/07/17 更新2025/07/17 發佈閱讀 4 分鐘

影像辨識是AI領域裡最直覺、也最好玩的應用之一。

我們在第一個例子就提過「教寶寶認蘋果」，那其實就是影像辨識的核心。現在，我們來深入看看，電腦究竟是**怎麼「看」**一張圖片的。

人類看一張貓的照片，會立刻認出「喔，是隻貓」。但電腦看到的完全不一樣，對電腦來說，一張圖片只是一大堆數字。

想像一下，你把一張照片無限放大，最後會看到什麼？沒錯，就是一個個微小的色塊，叫做「像素 (Pixel)」。電腦看到的就是這些像素的數值（例如：這個點的紅色是255、綠色是120、藍色是80）。

那麼，電腦要如何從這一堆雜亂的數字中，認出「貓」呢？

讓我們把電腦的學習過程，想像成一個從零開始玩樂高積木的小朋友。

用樂高學辨識 🧱

第一層：學習辨識「最小的積木」 (低階特徵)

一開始，電腦不會直接去找「貓的耳朵」或「貓的眼睛」，那太複雜了。

它會先從最基本的圖案學起，就像小朋友先認識最基本的樂高積木：

一條橫線 (一塊 2x1 的紅色積木)
一條直線 (一塊 1x2 的藍色積木)
一個角落 (一塊L形的積木)
一個漸層色塊
一個圓弧

電腦會掃描整張圖片，努力找出這些最基礎的「圖案積木」。

(電腦先學會辨識這些基礎線條和邊緣)

第二層：學習用積木「組裝小零件」 (中階特徵)

當電腦認識了基礎積木後，它會開始學習如何將這些積木組合成稍微複雜一點的「小零件」。

就像小朋友學會了：

「兩個圓弧」和「一個小圓點」可以組成一顆「眼睛」👀。
「好幾條直線」可以組成一排「鬍鬚」鬚。
「一個三角形的邊緣組合」可以變成一隻「耳朵」👂。

這時，電腦還不知道這是一隻貓，但他已經能在圖片中找到「眼睛」、「鬍鬚」、「耳朵」這些由基礎線條組成的「零件」了。

(再把線條組合成眼睛、鼻子等器官)

第三層：學習將零件「拼成完整的模型」 (高階特徵)

最後一步，就是把所有辨識出來的「零件」組合起來，拼出最終的模型。

小朋友學會了：如果我看到一個模型，它是由「兩隻尖尖的耳朵」＋「兩顆圓圓的眼睛」＋「一個倒三角的鼻子」＋「六根長長的鬍鬚」... 用這樣的空間關係組合在一起，那這個模型 99% 的機率就是「貓」！

(最後，將所有器官組合起來，就能認出整張臉)

生活中的影像辨識例子：

手機人臉解鎖 (Face ID)：你的手機就是用這個方法，學習了你臉上「眼睛、鼻子、嘴巴」這些零件的獨特組合方式，所以別人解不開。
停車場車牌辨識：系統先在畫面中找到「長方形」這個零件（車牌），然後再辨識裡面的「數字」和「字母」零件。
醫療影像分析：醫生可以訓練AI，讓它在X光片或CT掃描圖中，學會辨識出代表「腫瘤」或「病變」的特殊圖案組合。
自動駕駛：車子的電腦不斷地辨識路上的「行人」、「汽車」、「紅綠燈」、「斑馬線」等各種物體模型，才能安全行駛。

簡單來說：

影像辨識就是教電腦「拆解」畫面，從最基本的線條和顏色學起，一步步組合，最終認出複雜的物體。這是一個由小到大、由簡入繁的學習過程！

光說不練不過癮，對吧？

下一歩，我們將一起來玩一個由 Google 開發的超簡單AI工具 Teachable Machine？它可以讓你在幾分鐘內，「親手訓練」一個專屬於你的影像辨識模型喔！完全不用寫任何程式碼！

留言

Hank吳的沙龍

16會員

159內容數

這不僅僅是一個 Blog，更是一個交流與分享的空間。期待在這裡與你相遇，一起探索科技、體驗生活、夢想旅行！💖

你可能也想看

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

創作不只是個人戰，在 vocus ，也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」，現在有了更強大的新夥伴加入！除了大家熟悉的「官方主題沙龍」，這次我們徵召了 8 位領域各異的「個人主題專家」，將再度嘗試創作的各種可能，和格友們激發出更多未知的火花。

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

【野格團開箱｜上篇】首波新成員登場！5 題靈魂拷問，直擊「個人主題專家」的創作後台🔥

vocus 最具指標性的創作者社群──「野格團」， 2026 年春季，這支充滿專業、熱情的團隊再次擴編，迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇，他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。

#創作#創作者推薦#靈感

2026/03/25

方格子 vocus 官方沙龍

【野格團開箱｜上篇】首波新成員登場！5 題靈魂拷問，直擊「個人主題專家」的創作後台🔥

#創作#創作者推薦#靈感

2026/03/25

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

普普文創

【文創漫談】人工智慧與機器學習 | 如何利用AI | 增強能力

人工智慧是什麼？人工智慧（Artificial Intelligence, AI）簡單來說，就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序，可以執行許多原本需要人類智慧才能完成的工作，例如：語音辨識：讓電腦聽懂人類的語言，像是 Siri、Google As

#文創漫談#人工智慧與機器學習#如何利用AI

2024/07/30

普普文創

【文創漫談】人工智慧與機器學習 | 如何利用AI | 增強能力

#文創漫談#人工智慧與機器學習#如何利用AI

2024/07/30

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

本文要探討AI的任務與實戰場景。AI技術已深入生活各層面，從違約預測到都市交通管理。AI任務主要有三類：數值型資料處理、自然語言處理（NLP）和電腦影像辨識。時間序列資料和強化學習方法（如AlphaGo）也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化，了解這些基礎有助選擇適合研究方向

#ChatGPT#AlphaGo#人工智慧

2024/07/19

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

#ChatGPT#AlphaGo#人工智慧

2024/07/19

EC3

【 AI繪圖使用心得】

什麼是ＡＩ？ Artificial Intellgent ㄧ個數位大腦電腦新物種模擬人類的腦神經整合２Ｄ與３Ｄ的繪圖視覺在Bing 裡面基本上分為這幾個類型: 逼真的３Ｄ動畫動畫虛擬人偶展示攝影可愛貼圖二為圖例電腦科幻虛擬人偶公司標誌卡通電影海

2024/06/17

2024/06/17

不用靠電腦！用ESP32 x ArduinoIDE學AI機器學習｜[手勢辨識]

這篇文章介紹瞭如何利用單晶片來控制不同功能模組的應用，並分享了親手體驗的影片和遇到的卡關。文章強調了需要具備基礎程式語言撰寫的邏輯，以及解決卡關時需要個人調整程式碼的順序。

#程式#教材#科學

2024/05/08

D&Y熊繪生的沙龍

不用靠電腦！用ESP32 x ArduinoIDE學AI機器學習｜[手勢辨識]

#程式#教材#科學

2024/05/08

一二三的沙龍

探索ScreenAI：Google的革命性視覺語言模型

在數位化的世界中，用戶介面和信息圖表等視覺元素扮演著越來越重要的角色，而ScreenAI的開發為自然語言處理和計算機視覺的融合開啟了新的可能性。

#模型#語言#用戶

2024/03/26

一二三的沙龍

探索ScreenAI：Google的革命性視覺語言模型

在數位化的世界中，用戶介面和信息圖表等視覺元素扮演著越來越重要的角色，而ScreenAI的開發為自然語言處理和計算機視覺的融合開啟了新的可能性。

#模型#語言#用戶

2024/03/26

米奇幻世界

AI基本認識

AI，全稱人工智慧，是指讓電腦或機器具備類似人類的智慧和能力的科學和技術。AI 可以幫助我們解決各種問題，提高效率，創造價值，甚至改變世界。但是，你知道 AI 是如何運作的嗎？你知道 AI 的歷史和未來嗎？你知道 AI 的優點和挑戰嗎？在這篇文章中，我將帶你一起認識 AI 的基本概念和發展。

2024/03/08

2024/03/08

心情繪本｜DALL.E ｜單晶片｜開箱｜[學AI機器學習：不用靠電腦！]

誠品生活｜科技應用書櫃陳列著與AI相關軟硬體的科技應用實作材料包，包含物聯網、影像辨識、機器學習、生醫感測等實作套裝材料。選擇趨勢｜科技玩物這麼多科技應用實作包，怎麼選呢？科技日新月異科技玩物在生活中反應的特徵詞：顛覆、科幻、新奇、便利、酷炫、魔法、未來

#AI#機器學習#ML

2024/03/03

D&Y熊繪生的沙龍

心情繪本｜DALL.E ｜單晶片｜開箱｜[學AI機器學習：不用靠電腦！]

#AI#機器學習#ML

2024/03/03

美國人力資源港 - 九思觀點

何謂「人工智能」？What is AI?

AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域，包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性，還可解決複雜的問題和挑戰。

2024/02/23

2024/02/23

AI生成圖片氾濫，怎麼識別 AI 產生的圖片？3 大 AI 內容識別技術

AI 創作內容 (AIGC) 技術突飛猛進，人類已經越來越難辨識眼前所見照片、影片的真實度。為了讓使用者可以區別哪些是由 AI 產生的「非真實內容」，進而信任圖片的真實性，如：微軟、Adobe、Google、Midjourney、Nikon…等 AI 技術大廠紛紛建立起 AI 內容識別技術，幫助使用

#AI

2024/02/19

手哥科科

AI生成圖片氾濫，怎麼識別 AI 產生的圖片？3 大 AI 內容識別技術

#AI

2024/02/19

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News