[ 数据集 ] VOC 2012 数据集介绍
🤵 Author :Horizon Max
? 編程技巧篇:各種操作小結
🎇 機器視覺篇:會變魔術 OpenCV
💥 深度學習篇:簡單入門 PyTorch
🏆 神經(jīng)網(wǎng)絡篇:經(jīng)典網(wǎng)絡模型
💻 算法篇:再忙也別忘了 LeetCode
文章目錄
- VOC 2012
- 分類 / 檢測
- 分割
- VOC 2012 文件夾介紹
- 1)Annotations
- 2)ImageSets
- Action
- Layout
- Main
- Segmentation
- 3)JPEGImages
- 4)SegmentationClass
- 5)SegmentationObject
VOC 2012
它從根本上說是一個有監(jiān)督的學習問題,提供了一組標記圖像的訓練集。
包括二十個對象類別:
Person :person
Animal :bird, cat, cow, dog, horse, sheep
Vehicle :aeroplane, bicycle, boat, bus, car, motorbike, train
Indoor :bottle, chair, dining table, potted plant, sofa, tv/monitor
有三個主要的對象識別競賽:分類 、檢測 和 分割 ;
官方鏈接 :VOC 2012
下載鏈接 : training / validation data
官方文檔 : (VOC2012) 開發(fā)套件
分類 / 檢測
(1)分類 :對于 20 個類中的每一個,預測測試圖像中該類示例的存在/不存在 ;
(2)檢測 :從測試圖像中的 20 個目標類別中預測每個對象的邊界框和標簽 ;
分割
(1)分割:生成逐像素分割,給出在每個像素處可見的對象類別,否則為“背景” ;
VOC 2012 文件夾介紹
VOC 2012 文件夾下一共包括 5 個子文件夾
1)Annotations
文件為 XML格式 的圖片標注信息
以其中一個為例:
里面包含的信息有:圖像數(shù)據(jù)的 名稱、地址,目標的種類、位置等 ;
2)ImageSets
ImageSets 下有 4 個子文件夾
train.txt:訓練集相關數(shù)據(jù)
val.txt:驗證集相關數(shù)據(jù)
trainval.txt:訓練集與驗證集合并后的相關數(shù)據(jù)
Action
1、Action:與人體動作相關的數(shù)據(jù),包括三個部分(train.txt、trainval.txt、val.txt),對應的動作有 jumping、phoning 等 ;
用于 人體動作分類競賽 (Action Classification Competition)
Layout
2、Layout:與人體部位相關的數(shù)據(jù),包括三個部分(train.txt、trainval.txt、val.txt),對應的部位有 head、hand、feet 等 ;
用于 人體部位檢測競賽 (Person Layout Taster Competition)
Main
3、Main:與目標檢測相關的數(shù)據(jù),包括三個部分(train.txt、trainval.txt、val.txt),一共包括 20 個類別 ;
用于 圖像分類 / 檢測競賽 (Classification/Detection Competitions)
Segmentation
4、Segmentation:與圖像分割相關的數(shù)據(jù),包括三個部分(train.txt、trainval.txt、val.txt)
用于 圖像分割競賽 (Segmentation Competition)
3)JPEGImages
VOC 2012 數(shù)據(jù)集提供的所有的 .jpg 格式的圖片,訓練集和測試集一共 17125 張 ;
命名格式:“年份_編號.jpg”,與 1)Annotations 中的標簽相對應,圖片的像素尺寸不相同 ;
4)SegmentationClass
語義分割標注掩模圖,一共 2913 張 ;
5)SegmentationObject
實例分割標注掩模圖,一共 2913 張 ;
以其中一張 2007_000129.jpg 為例,將 原始圖像 、語義分割圖像 、實例分割圖像 放在一起進行比較 :
原始圖像(JPEGImages) :數(shù)據(jù)標簽都存放在 Annotations 文檔內(nèi) ;
語義分割圖像(SegmentationClass) :同一物體類別顏色一樣,不同物體類別顏色不同 ;
實例分割圖像 (SegmentationObject) :同一物體類別 和 不同物體類別顏色都不同 ;
2007_000129.jpg 對應的 Annotations 文件:
<size>:圖片尺寸 width、height、depth ;
<object>:圖片內(nèi)的目標 (bicycle、person 各有三個 object );
<name> :目標名稱,對應著 bicycle、person ;
<pose> :拍攝角度
<truncated> :目標檢測框是否被截斷(1為是,0為否);
<difficult> :目標是否難以識別(1為是,0為否);
<bndbox> :bounding box 目標框的位置,對應著 左上角 和 右下角 的兩個坐標 ;
總結
以上是生活随笔為你收集整理的[ 数据集 ] VOC 2012 数据集介绍的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ChIPQC——对ChIP-seq的质量
- 下一篇: 群晖3617可以有几个网卡_一步到位,购