分割任務評估指標是用於衡量圖像分割模型性能的各種量化指標。圖像分割的目標是將圖像中的每個像素分配到一個特定的類別,因此評估指標需要能夠反映模型在像素級別的分類準確性以及分割區域的質量。
以下是一些主要的分割任務評估指標:
1. 像素準確率 (Pixel Accuracy, PA):像素準確率是最簡單的評估指標,它計算的是被正確分類的像素數量佔總像素數量的比例。
PA = (正確分類的像素數) / (總像素數)
雖然直觀,但像素準確率在類別不平衡的情況下可能會產生誤導性的高分,因為模型可能只是大量預測為佔據主導地位的類別。
2. 均交並比 (Mean Intersection over Union, mIoU):
均交並比是最常用的分割任務評估指標之一。它衡量的是模型預測的分割區域與真實標註的分割區域之間的重疊程度。
- 首先,對於每個類別 i,計算其交並比 (Intersection over Union, IoU),也稱為 Jaccard 指數:
IoU_i = Area(Predicted_i ∩ GroundTruth_i) / Area(Predicted_i ∪ GroundTruth_i)
其中,Predicted_i
是模型預測的屬於類別 i 的像素集合,GroundTruth_i
是真實標註的屬於類別 i 的像素集合。交集表示預測正確的屬於類別 i 的像素,並集表示所有被預測為或實際屬於類別 i 的像素。 - 然後,mIoU 是所有類別 IoU 的平均值:
mIoU = (∑_{i=1}^{n} IoU_i) / n
其中 n 是類別的總數。
mIoU 能夠更好地反映模型在所有類別上的平均性能,尤其是在類別不平衡的情況下。
3. Dice 係數 (Dice Coefficient) / F1 分數 (for Segmentation):
Dice 係數是另一個衡量兩個分割區域之間相似性的指標,尤其在醫學圖像分割中常用。它與 IoU 密切相關:
Dice = 2 * |Predicted ∩ GroundTruth| / (|Predicted| + |GroundTruth|)
其中,|Predicted ∩ GroundTruth|
是預測區域和真實區域的交集中的像素數量,|Predicted|
和 |GroundTruth|
分別是預測區域和真實區域中的像素數量。
對於每個類別,可以計算 Dice 係數,然後取所有類別的平均值(Mean Dice Coefficient)。Dice 係數也可以看作是分割任務的 F1 分數。
4. 精確度 (Precision) 和 召回率 (Recall) (for Segmentation):
與分類任務類似,也可以在像素級別上計算每個類別的精確度和召回率:
- 精確度 (Precision): 在所有被模型預測為屬於某個類別的像素中,實際屬於該類別的像素所佔的比例。
Precision_i = TP_i / (TP_i + FP_i)
其中TP_i
是真正例(正確預測為類別 i 的像素),FP_i
是假正例(錯誤預測為類別 i 的像素)。 - 召回率 (Recall): 在所有真實屬於某個類別的像素中,被模型正確預測為該類別的像素所佔的比例。
Recall_i = TP_i / (TP_i + FN_i)
其中FN_i
是假負例(實際屬於類別 i 但被模型預測為其他類別的像素)。
可以計算每個類別的精確度和召回率,然後取平均值。
5. 分割邊界準確性:
除了像素級別的指標外,還可以評估模型分割出的物體邊界的準確性,例如通過計算預測邊界與真實邊界之間的距離。
選擇哪個指標取決於具體的應用場景和需求。 例如,在醫學圖像分割中,Dice 係數和 IoU 由於對區域重疊的敏感性,可能比像素準確率更常用。在類別非常不平衡的情況下,mIoU 能夠提供更可靠的整體性能評估。
總之,分割任務的評估需要仔細考慮像素級別的分類準確性和分割區域的質量,多種指標通常會被一起使用以全面評估模型的性能。