COCO(Common Objects in Context)

更新 發佈閱讀 3 分鐘

COCO(Common Objects in Context)是一個大規模且廣泛使用的影像數據集,主要用於計算機視覺領域中的目標檢測(Detection)、圖像分割(Segmentation)、以及圖像描述(Captioning)等任務。以下是COCO資料集的重點介紹:

  • 規模與內容
    COCO包含約33萬張圖像,其中約有20萬張圖像具有詳細的物件標註。這些標註涵蓋80個不同的物件類別,包括常見物品如人、汽車、動物,也包含更細分的物品如雨傘、手提包、運動器材等。
  • 資料標註
    每張圖片的標註包括物件的邊界框(bounding box)、精細的分割掩碼(segmentation mask),以及部分資料集中還包含關鍵點(例如人體關節位置)的標註。這些豐富的標註讓COCO適合訓練與測試多種視覺任務。
  • 資料集結構
    COCO分為三個主要的子集:
    • Train2017:約11.8萬張圖像,主要用於模型訓練。
    • Val2017:約5千張圖像,用於訓練過程中的驗證。
    • Test2017:約2萬張圖像,用於模型測試,該部分的標註通常不公開,需要提交結果到官方網站評估模型效能。
  • 評估標準
    COCO提供標準化的評估指標,例如目標檢測中的平均精度均值(mAP),以及分割任務中的平均召回率(mAR),使得不同模型的性能可以被公平比較。
  • 應用
    COCO資料集常被用於訓練和評估深度學習模型,如YOLO、Faster R-CNN、Mask R-CNN等。由於其多樣化的物件類別和豐富的標註,使其成為計算機視覺領域重要的基準數據集。
  • 技術特色
    COCO在訓練中常使用如“Mosaicing”技術,該技術能將多張圖像拼接,增加模型對不同大小及上下文下物件的泛化能力。

總結來說,COCO是一個豐富且完整的計算機視覺數據集,適合用於目標檢測、圖像分割、關鍵點標註等多種任務的研究與開發,亦是評估現代視覺模型性能的重要標準之一。


留言
avatar-img
留言分享你的想法!
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
19會員
495內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)
2025/08/14
ImageNet 是一個非常重要且廣泛使用的大型影像數據庫,主要用於機器學習和計算機視覺的研究領域。以下是關於 ImageNet 的主要介紹: 規模與內容: ImageNet 數據集包含超過一千四百萬張標註過的高解析度圖片,涵蓋了約兩萬多個類別(Synset,根據 WordNet 進行組織)。其中
2025/08/14
ImageNet 是一個非常重要且廣泛使用的大型影像數據庫,主要用於機器學習和計算機視覺的研究領域。以下是關於 ImageNet 的主要介紹: 規模與內容: ImageNet 數據集包含超過一千四百萬張標註過的高解析度圖片,涵蓋了約兩萬多個類別(Synset,根據 WordNet 進行組織)。其中
2025/08/14
自回歸(autoregressive)模型是一種在機器學習和統計學中常用的方法,主要用來處理序列數據的預測。它的基本概念是:序列中的當前值是過去值的函數,藉由利用序列中先前的數據點來預測下一個數據點。 具體來說,自回歸模型會根據時間序列中前面一段時間(稱為滯後期數)的觀測值,透過線性組合與隨機誤差
2025/08/14
自回歸(autoregressive)模型是一種在機器學習和統計學中常用的方法,主要用來處理序列數據的預測。它的基本概念是:序列中的當前值是過去值的函數,藉由利用序列中先前的數據點來預測下一個數據點。 具體來說,自回歸模型會根據時間序列中前面一段時間(稱為滯後期數)的觀測值,透過線性組合與隨機誤差
2025/08/14
Latent Space(潛空間、潛在空間)是機器學習、特別是深度學習中的一個重要概念。簡單來說,它是一個低維度的數據空間,用來捕捉和表示高維度數據(如圖片、音頻、文本)中的隱藏特徵或模式。 具體來說: 潛空間的含義:Latent意為「隱藏的」,Latent Space就是指一個「隱藏的空間」,
2025/08/14
Latent Space(潛空間、潛在空間)是機器學習、特別是深度學習中的一個重要概念。簡單來說,它是一個低維度的數據空間,用來捕捉和表示高維度數據(如圖片、音頻、文本)中的隱藏特徵或模式。 具體來說: 潛空間的含義:Latent意為「隱藏的」,Latent Space就是指一個「隱藏的空間」,
看更多
你可能也想看
Thumbnail
透過蝦皮分潤計畫,輕鬆賺取零用金!本文分享5-6月實測心得,包含數據流程、實際收入、平臺優點及注意事項,並推薦高分潤商品,教你如何運用空閒時間創造被動收入。
Thumbnail
透過蝦皮分潤計畫,輕鬆賺取零用金!本文分享5-6月實測心得,包含數據流程、實際收入、平臺優點及注意事項,並推薦高分潤商品,教你如何運用空閒時間創造被動收入。
Thumbnail
單身的人有些會養寵物,而我養植物。畢竟寵物離世會傷心,植物沒養好再接再厲就好了~(笑)
Thumbnail
單身的人有些會養寵物,而我養植物。畢竟寵物離世會傷心,植物沒養好再接再厲就好了~(笑)
Thumbnail
不知你有沒有過這種經驗?衛生紙只剩最後一包、洗衣精倒不出來,或電池突然沒電。這次一次補貨,從電池、衛生紙到洗衣精,還順便分享使用心得。更棒的是,搭配蝦皮分潤計畫,愛用品不僅自己用得安心,分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E,輕鬆上手,隨時隨地賺取分潤!
Thumbnail
不知你有沒有過這種經驗?衛生紙只剩最後一包、洗衣精倒不出來,或電池突然沒電。這次一次補貨,從電池、衛生紙到洗衣精,還順便分享使用心得。更棒的是,搭配蝦皮分潤計畫,愛用品不僅自己用得安心,分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E,輕鬆上手,隨時隨地賺取分潤!
Thumbnail
身為一個典型的社畜,上班時間被會議、進度、KPI 塞得滿滿,下班後只想要找一個能夠安靜喘口氣的小角落。對我來說,畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉,還是慢慢描繪喜歡的插畫人物,那個專注在筆觸和色彩的過程,就像在幫心靈按摩一樣,讓緊繃的神經慢慢鬆開。
Thumbnail
身為一個典型的社畜,上班時間被會議、進度、KPI 塞得滿滿,下班後只想要找一個能夠安靜喘口氣的小角落。對我來說,畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉,還是慢慢描繪喜歡的插畫人物,那個專注在筆觸和色彩的過程,就像在幫心靈按摩一樣,讓緊繃的神經慢慢鬆開。
Thumbnail
繫詞(英語:copula、複數為copulas或copulae、英文簡稱cop),又譯為繫動詞、聯繫動詞,在語言學為表示用於與謂詞(主語補語)鏈接句子之主詞的字詞
Thumbnail
繫詞(英語:copula、複數為copulas或copulae、英文簡稱cop),又譯為繫動詞、聯繫動詞,在語言學為表示用於與謂詞(主語補語)鏈接句子之主詞的字詞
Thumbnail
本文將說明如何去辨識出圖片文字​位置及高寬。
Thumbnail
本文將說明如何去辨識出圖片文字​位置及高寬。
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
學習如何使用 Tensorflow.js 的 COCO-SSD 模型在網頁上進行圖片物件辨識,包括基本使用方法、進階應用及實作範例,輕鬆辨識圖片中的人數和物件。
Thumbnail
學習如何使用 Tensorflow.js 的 COCO-SSD 模型在網頁上進行圖片物件辨識,包括基本使用方法、進階應用及實作範例,輕鬆辨識圖片中的人數和物件。
Thumbnail
有鑑於於市場上總是無法將 CPO 技術與光通訊模組之架構、運行方式與發展個別說清,讓非技術背景出身之投資人容易產生混淆,個人則希望透過本篇介紹將讓投資人對於 CPO 技術有一基本認知。下一篇則將針對該族群進行營運與財務數據分析。 (本篇僅開放2小時觀看,之後僅供訂閱會員參考! 歡迎加入訂閱
Thumbnail
有鑑於於市場上總是無法將 CPO 技術與光通訊模組之架構、運行方式與發展個別說清,讓非技術背景出身之投資人容易產生混淆,個人則希望透過本篇介紹將讓投資人對於 CPO 技術有一基本認知。下一篇則將針對該族群進行營運與財務數據分析。 (本篇僅開放2小時觀看,之後僅供訂閱會員參考! 歡迎加入訂閱
Thumbnail
介紹OpenCV中的cv2.matchTemplate和cv2.minMaxLoc函數的使用方法和參數,提供程式範例以及相關特徵匹配的詳細介紹,讓讀者對此有更深入的瞭解。
Thumbnail
介紹OpenCV中的cv2.matchTemplate和cv2.minMaxLoc函數的使用方法和參數,提供程式範例以及相關特徵匹配的詳細介紹,讓讀者對此有更深入的瞭解。
Thumbnail
寬景Wide view 鳥瞰Bird view 前景Foreground 背景Background 正面Front View 側面Side View 俯視Top View 景深Depth of field 微距鏡頭Macro Shot 超特寫Extreme Close up
Thumbnail
寬景Wide view 鳥瞰Bird view 前景Foreground 背景Background 正面Front View 側面Side View 俯視Top View 景深Depth of field 微距鏡頭Macro Shot 超特寫Extreme Close up
Thumbnail
直方圖是對圖像中像素強度分布的圖形表示。通過分析直方圖,我們可以獲得有關圖像對比度、亮度和色彩分佈的有用信息。
Thumbnail
直方圖是對圖像中像素強度分布的圖形表示。通過分析直方圖,我們可以獲得有關圖像對比度、亮度和色彩分佈的有用信息。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News