圖像分類 (Image Classification)

iPAS AI應用規劃師學習筆記

發佈於電腦視覺技術與應用

更新於 2025/08/08發佈於 2025/05/26閱讀時間約 4 分鐘

「圖像分類 (Image Classification)」是電腦視覺領域的一個基本任務，旨在讓電腦能夠自動地將輸入的圖像分配到預定義的類別或標籤中。簡單來說，圖像分類系統會分析圖像的內容，並判斷圖像中包含的是什麼。

你可以將圖像分類想像成給定一張圖片，然後讓電腦告訴你這張圖片裡是什麼，例如是貓、狗、汽車、飛機等等。

圖像分類的目標：

圖像分類系統的主要目標是學習圖像的視覺模式和特徵，並將這些模式與特定的類別標籤相關聯。當給定一張新的、未見過的圖像時，系統應該能夠預測它最有可能屬於哪個類別。

圖像分類的工作原理 (概括)：

一個典型的圖像分類系統通常包含以下步驟：

輸入圖像 (Input Image): 系統接收一張數位圖像作為輸入。
特徵提取 (Feature Extraction): 系統會提取圖像中與不同類別相關的視覺特徵。這些特徵可以是底層的像素信息，也可以是更高級的紋理、形狀或物體部件等。常用的特徵提取方法包括傳統的手工設計特徵（例如 SIFT、HOG）和深度學習模型（例如卷積神經網路 CNN）自動學習到的特徵。
模型訓練 (Model Training): 系統會使用大量的帶有標籤的訓練數據（即已知類別的圖像）來訓練一個分類模型。模型學習如何將提取到的特徵映射到正確的類別標籤。常用的分類模型包括支持向量機 (SVM)、邏輯回歸 (Logistic Regression) 和各種深度學習模型。
預測 (Prediction): 當給定一張新的圖像時，系統會使用訓練好的模型提取其特徵，並預測該圖像最有可能屬於哪個類別。
輸出 (Output): 系統會輸出預測的類別標籤（通常會伴隨著一個表示預測可信度的概率值）。

圖像分類的應用：

圖像分類技術被廣泛應用於許多領域：

物體識別 (Object Recognition): 識別圖像中特定物體的種類，例如識別圖片中的汽車品牌和型號。
人臉識別 (Face Recognition): 識別圖像中的人物。
醫學影像分析 (Medical Image Analysis): 對醫學影像（例如 X 光片、CT 掃描）進行分類，以輔助診斷疾病。
產品識別 (Product Recognition): 在電子商務或零售業中，識別圖像中的產品。
圖像檢索 (Image Retrieval): 根據圖像的內容對圖像進行分類和索引，以便進行更精準的搜索。
自動駕駛 (Autonomous Driving): 識別道路標誌、交通信號、行人和其他車輛。
安防監控 (Security Surveillance): 分析監控錄像，識別異常行為或可疑物體。
內容審核 (Content Moderation): 自動分類和標記不適當或有害的圖像內容。

總之，圖像分類是一個非常重要的電腦視覺任務，它使得機器能夠理解圖像的內容並將其歸類，為許多智能應用提供了基礎。

含 AI 應用內容

郝信華 iPAS AI應用規劃師學習筆記電腦視覺技術與應用常見的電腦視覺任務

留言

留言分享你的想法！

郝信華 iPAS AI應用規劃師學習筆記

15會員

363內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/05/26

人臉關鍵點偵測 (Facial Landmark Detection)

「人臉關鍵點偵測 (Facial Landmark Detection)」，也稱為「臉部特徵點偵測」或「臉部對齊 (Facial Alignment)」，是電腦視覺領域中一個重要的任務。它是姿態估計 (Pose Estimation) 的一個特定應用，專門針對人臉。其目標是在人臉圖像或影片中自動定位

2025/05/26

人臉關鍵點偵測 (Facial Landmark Detection)

2025/05/26

姿態估計 (Pose Estimation)

「姿態估計 (Pose Estimation)」是電腦視覺領域的一個任務，旨在識別並定位圖像或影片中特定物體的關鍵點。最常見的應用是對人體進行姿態估計，即識別並定位人體的關鍵關節（例如頭部、肩膀、肘部、手腕、膝蓋、腳踝等）。然而，姿態估計也可以應用於其他物體，例如動物、車輛或手部等。你可以將姿態

2025/05/26

姿態估計 (Pose Estimation)

2025/05/26

影片分析 (Video Analysis)

「影片分析 (Video Analysis)」是電腦視覺領域的一個分支，專注於從影片序列中提取、處理、理解和解釋有意義的信息。它不僅僅是分析單獨的靜態圖像，更重要的是要理解影片中時間維度上的信息，例如物體的運動、行為的發生、事件的發展等等。你可以將影片分析想像成讓電腦能夠像人類一樣觀看影片，並且

2025/05/26

影片分析 (Video Analysis)