圖像分割 (Image Segmentation)

iPAS AI應用規劃師學習筆記

發佈於電腦視覺技術與應用

2025/08/08 更新2025/05/26 發佈閱讀 4 分鐘

「圖像分割 (Image Segmentation)」是電腦視覺領域的一個核心任務，它的目標是將圖像中的每個像素都分配到一個特定的類別或區域，從而將圖像分割成多個有意義的片段。

你可以將圖像分割想像成給圖像的每個像素都塗上顏色，顏色相同的像素屬於同一個物體或區域。

圖像分割與圖像分類和物件偵測的區別：

圖像分類 (Image Classification): 目標是判斷整張圖像屬於哪個類別。
物件偵測 (Object Detection): 目標是在圖像中找出特定物體的位置，通常通過邊界框標示，並識別其類別。
圖像分割 (Image Segmentation): 目標是對圖像進行像素級別的分類，確定每個像素屬於哪個物體或區域。

圖像分割的類型：

圖像分割主要可以分為兩種：

語義分割 (Semantic Segmentation):
- 目標是將圖像中的每個像素都分配到一個語義類別（例如人、汽車、天空、道路）。它不區分屬於同一類別的不同個體。例如，圖像中所有的汽車像素都會被標記為「汽車」這個類別，即使圖像中有好幾輛不同的汽車。
實例分割 (Instance Segmentation):
- 目標是將圖像中的每個像素都分配到一個特定的物件實例。它不僅識別出每個物體的類別，還區分出屬於同一類別的不同個體。例如，圖像中每輛不同的汽車都會被標記為一個獨立的實例，即使它們都屬於「汽車」這個類別。

圖像分割的工作原理：

圖像分割算法通常使用卷積神經網路 (CNN) 等深度學習模型。這些模型學習從圖像中提取能夠區分不同類別的特徵，並在像素級別進行預測。一些常用的模型架構包括：

全卷積網路 (Fully Convolutional Networks, FCNs)
U-Net
Mask R-CNN (用於實例分割)

這些模型通常會先通過編碼器部分提取圖像的特徵，然後通過解碼器部分將這些特徵映射回原始圖像的像素空間，並進行像素級別的分類。

圖像分割的應用：

圖像分割技術在許多領域都有廣泛的應用：

自動駕駛 (Autonomous Driving): 理解道路場景，例如識別道路、車道線、行人、車輛等。
醫療影像分析 (Medical Image Analysis): 分割醫學圖像中的器官、病灶等，輔助診斷。
場景理解 (Scene Understanding): 理解圖像中不同物體和區域的語義信息。
影像編輯 (Image Editing): 精確地選取圖像中的特定區域進行編輯或替換。
擴增實境 (Augmented Reality, AR): 將虛擬內容精確地疊加到真實世界的特定物體上。
衛星影像分析 (Satellite Image Analysis): 分析地表覆蓋、土地利用等信息。
工業檢測 (Industrial Inspection): 檢測產品表面的缺陷，並精確定位缺陷區域。

總之，圖像分割是一項非常重要的電腦視覺任務，它能夠提供對圖像內容更精細的理解，為各種應用帶來了更強大的能力。

含 AI 應用內容

郝信華 iPAS AI應用規劃師學習筆記電腦視覺技術與應用常見的電腦視覺任務

留言

郝信華 iPAS AI應用規劃師學習筆記

43會員

571內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師初級+中級(數據分析) AWS Certified AI Practitioner (AIF-C01) 其他：富邦美術館志工

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/05/26

人臉關鍵點偵測 (Facial Landmark Detection)

「人臉關鍵點偵測 (Facial Landmark Detection)」，也稱為「臉部特徵點偵測」或「臉部對齊 (Facial Alignment)」，是電腦視覺領域中一個重要的任務。它是姿態估計 (Pose Estimation) 的一個特定應用，專門針對人臉。其目標是在人臉圖像或影片中自動定位

2025/05/26

人臉關鍵點偵測 (Facial Landmark Detection)

2025/05/26

姿態估計 (Pose Estimation)

「姿態估計 (Pose Estimation)」是電腦視覺領域的一個任務，旨在識別並定位圖像或影片中特定物體的關鍵點。最常見的應用是對人體進行姿態估計，即識別並定位人體的關鍵關節（例如頭部、肩膀、肘部、手腕、膝蓋、腳踝等）。然而，姿態估計也可以應用於其他物體，例如動物、車輛或手部等。你可以將姿態

2025/05/26

姿態估計 (Pose Estimation)

2025/05/26

影片分析 (Video Analysis)

「影片分析 (Video Analysis)」是電腦視覺領域的一個分支，專注於從影片序列中提取、處理、理解和解釋有意義的信息。它不僅僅是分析單獨的靜態圖像，更重要的是要理解影片中時間維度上的信息，例如物體的運動、行為的發生、事件的發展等等。你可以將影片分析想像成讓電腦能夠像人類一樣觀看影片，並且

2025/05/26

影片分析 (Video Analysis)

看更多

你可能也想看

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇：帕拉贊諾夫的十段殘篇》，如何以十段殘篇，結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭，探討藝術在儀式消失的現代社會如何承接意義，並展現不羈的自由靈魂。

#釀電影#釀評論#藝術評論

2026/02/11

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

#釀電影#釀評論#藝術評論

2026/02/11

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11