COCO(Common Objects in Context)

更新於 發佈於 閱讀時間約 3 分鐘

COCO(Common Objects in Context)是一個大規模且廣泛使用的影像數據集,主要用於計算機視覺領域中的目標檢測(Detection)、圖像分割(Segmentation)、以及圖像描述(Captioning)等任務。以下是COCO資料集的重點介紹:

  • 規模與內容
    COCO包含約33萬張圖像,其中約有20萬張圖像具有詳細的物件標註。這些標註涵蓋80個不同的物件類別,包括常見物品如人、汽車、動物,也包含更細分的物品如雨傘、手提包、運動器材等。
  • 資料標註
    每張圖片的標註包括物件的邊界框(bounding box)、精細的分割掩碼(segmentation mask),以及部分資料集中還包含關鍵點(例如人體關節位置)的標註。這些豐富的標註讓COCO適合訓練與測試多種視覺任務。
  • 資料集結構
    COCO分為三個主要的子集:
    • Train2017:約11.8萬張圖像,主要用於模型訓練。
    • Val2017:約5千張圖像,用於訓練過程中的驗證。
    • Test2017:約2萬張圖像,用於模型測試,該部分的標註通常不公開,需要提交結果到官方網站評估模型效能。
  • 評估標準
    COCO提供標準化的評估指標,例如目標檢測中的平均精度均值(mAP),以及分割任務中的平均召回率(mAR),使得不同模型的性能可以被公平比較。
  • 應用
    COCO資料集常被用於訓練和評估深度學習模型,如YOLO、Faster R-CNN、Mask R-CNN等。由於其多樣化的物件類別和豐富的標註,使其成為計算機視覺領域重要的基準數據集。
  • 技術特色
    COCO在訓練中常使用如“Mosaicing”技術,該技術能將多張圖像拼接,增加模型對不同大小及上下文下物件的泛化能力。

總結來說,COCO是一個豐富且完整的計算機視覺數據集,適合用於目標檢測、圖像分割、關鍵點標註等多種任務的研究與開發,亦是評估現代視覺模型性能的重要標準之一。


留言
avatar-img
留言分享你的想法!
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
15會員
363內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)
2025/08/14
ImageNet 是一個非常重要且廣泛使用的大型影像數據庫,主要用於機器學習和計算機視覺的研究領域。以下是關於 ImageNet 的主要介紹: 規模與內容: ImageNet 數據集包含超過一千四百萬張標註過的高解析度圖片,涵蓋了約兩萬多個類別(Synset,根據 WordNet 進行組織)。其中
2025/08/14
ImageNet 是一個非常重要且廣泛使用的大型影像數據庫,主要用於機器學習和計算機視覺的研究領域。以下是關於 ImageNet 的主要介紹: 規模與內容: ImageNet 數據集包含超過一千四百萬張標註過的高解析度圖片,涵蓋了約兩萬多個類別(Synset,根據 WordNet 進行組織)。其中
2025/08/14
自回歸(autoregressive)模型是一種在機器學習和統計學中常用的方法,主要用來處理序列數據的預測。它的基本概念是:序列中的當前值是過去值的函數,藉由利用序列中先前的數據點來預測下一個數據點。 具體來說,自回歸模型會根據時間序列中前面一段時間(稱為滯後期數)的觀測值,透過線性組合與隨機誤差
2025/08/14
自回歸(autoregressive)模型是一種在機器學習和統計學中常用的方法,主要用來處理序列數據的預測。它的基本概念是:序列中的當前值是過去值的函數,藉由利用序列中先前的數據點來預測下一個數據點。 具體來說,自回歸模型會根據時間序列中前面一段時間(稱為滯後期數)的觀測值,透過線性組合與隨機誤差
2025/08/14
Latent Space(潛空間、潛在空間)是機器學習、特別是深度學習中的一個重要概念。簡單來說,它是一個低維度的數據空間,用來捕捉和表示高維度數據(如圖片、音頻、文本)中的隱藏特徵或模式。 具體來說: 潛空間的含義:Latent意為「隱藏的」,Latent Space就是指一個「隱藏的空間」,
2025/08/14
Latent Space(潛空間、潛在空間)是機器學習、特別是深度學習中的一個重要概念。簡單來說,它是一個低維度的數據空間,用來捕捉和表示高維度數據(如圖片、音頻、文本)中的隱藏特徵或模式。 具體來說: 潛空間的含義:Latent意為「隱藏的」,Latent Space就是指一個「隱藏的空間」,
看更多
你可能也想看
Thumbnail
繫詞(英語:copula、複數為copulas或copulae、英文簡稱cop),又譯為繫動詞、聯繫動詞,在語言學為表示用於與謂詞(主語補語)鏈接句子之主詞的字詞
Thumbnail
繫詞(英語:copula、複數為copulas或copulae、英文簡稱cop),又譯為繫動詞、聯繫動詞,在語言學為表示用於與謂詞(主語補語)鏈接句子之主詞的字詞
Thumbnail
本文將說明如何去辨識出圖片文字​位置及高寬。
Thumbnail
本文將說明如何去辨識出圖片文字​位置及高寬。
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
學習如何使用 Tensorflow.js 的 COCO-SSD 模型在網頁上進行圖片物件辨識,包括基本使用方法、進階應用及實作範例,輕鬆辨識圖片中的人數和物件。
Thumbnail
學習如何使用 Tensorflow.js 的 COCO-SSD 模型在網頁上進行圖片物件辨識,包括基本使用方法、進階應用及實作範例,輕鬆辨識圖片中的人數和物件。
Thumbnail
有鑑於於市場上總是無法將 CPO 技術與光通訊模組之架構、運行方式與發展個別說清,讓非技術背景出身之投資人容易產生混淆,個人則希望透過本篇介紹將讓投資人對於 CPO 技術有一基本認知。下一篇則將針對該族群進行營運與財務數據分析。 (本篇僅開放2小時觀看,之後僅供訂閱會員參考! 歡迎加入訂閱
Thumbnail
有鑑於於市場上總是無法將 CPO 技術與光通訊模組之架構、運行方式與發展個別說清,讓非技術背景出身之投資人容易產生混淆,個人則希望透過本篇介紹將讓投資人對於 CPO 技術有一基本認知。下一篇則將針對該族群進行營運與財務數據分析。 (本篇僅開放2小時觀看,之後僅供訂閱會員參考! 歡迎加入訂閱
Thumbnail
介紹OpenCV中的cv2.matchTemplate和cv2.minMaxLoc函數的使用方法和參數,提供程式範例以及相關特徵匹配的詳細介紹,讓讀者對此有更深入的瞭解。
Thumbnail
介紹OpenCV中的cv2.matchTemplate和cv2.minMaxLoc函數的使用方法和參數,提供程式範例以及相關特徵匹配的詳細介紹,讓讀者對此有更深入的瞭解。
Thumbnail
寬景Wide view 鳥瞰Bird view 前景Foreground 背景Background 正面Front View 側面Side View 俯視Top View 景深Depth of field 微距鏡頭Macro Shot 超特寫Extreme Close up
Thumbnail
寬景Wide view 鳥瞰Bird view 前景Foreground 背景Background 正面Front View 側面Side View 俯視Top View 景深Depth of field 微距鏡頭Macro Shot 超特寫Extreme Close up
Thumbnail
直方圖是對圖像中像素強度分布的圖形表示。通過分析直方圖,我們可以獲得有關圖像對比度、亮度和色彩分佈的有用信息。
Thumbnail
直方圖是對圖像中像素強度分布的圖形表示。通過分析直方圖,我們可以獲得有關圖像對比度、亮度和色彩分佈的有用信息。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News