CIFAR-10是一個廣泛應用於機器學習與計算機視覺領域的影像數據集,具備以下主要特點:
- 數據規模:總共包含60,000張彩色圖片,圖像尺寸為32×32像素。
- 類別數量與平衡性:涵蓋10個不同類別,每個類別有6,000張圖片。
- 訓練與測試集:分為50,000張訓練圖片和10,000張測試圖片。
- 10個類別:飛機(airplane)、汽車(automobile)、鳥(bird)、貓(cat)、鹿(deer)、狗(dog)、青蛙(frog)、馬(horse)、船(ship)和卡車(truck)。
- 用途:常用於訓練與評估影像分類模型,如卷積神經網絡(CNN)、支援向量機(SVM)等,因為數據既多樣且解析度適中,適合快速實驗與模型驗證。
- 歷史背景:由加拿大高級研究院(Canadian Institute For Advanced Research, CIFAR)研究人員Alex Krizhevsky等人於2009年發布,是80 Million Tiny Images數據集的一個子集。
- 應用價值:該資料集是圖像辨識任務中的經典基準,用於推動深度學習在影像分類領域的發展。
簡言之,CIFAR-10是一個結構清晰、規模適中且涵蓋多樣類別的彩色影像數據集,適合作為深度學習影像分類任務的標準測試集和入門資料,具有極高的教學和研究價值。