當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

[ 数据集 ] VOC 2012 数据集介绍

發(fā)布時間：2023/12/14 编程问答 24 豆豆

生活随笔收集整理的這篇文章主要介紹了 [ 数据集 ] VOC 2012 数据集介绍小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

🤵 Author ：Horizon Max

? 編程技巧篇：各種操作小結

🎇 機器視覺篇：會變魔術 OpenCV

💥 深度學習篇：簡單入門 PyTorch

🏆 神經(jīng)網(wǎng)絡篇：經(jīng)典網(wǎng)絡模型

💻 算法篇：再忙也別忘了 LeetCode

文章目錄

VOC 2012
- 分類 / 檢測
- 分割
VOC 2012 文件夾介紹
- 1）Annotations
- 2）ImageSets
- - Action
  - Layout
  - Main
  - Segmentation
- 3）JPEGImages
- 4）SegmentationClass
- 5）SegmentationObject

VOC 2012

它從根本上說是一個有監(jiān)督的學習問題，提供了一組標記圖像的訓練集。

包括二十個對象類別：

Person ：person
Animal ：bird, cat, cow, dog, horse, sheep
Vehicle ：aeroplane, bicycle, boat, bus, car, motorbike, train
Indoor ：bottle, chair, dining table, potted plant, sofa, tv/monitor

有三個主要的對象識別競賽：分類、檢測和分割；

官方鏈接：VOC 2012
下載鏈接： training / validation data
官方文檔： (VOC2012) 開發(fā)套件

分類 / 檢測

（1）分類：對于 20 個類中的每一個，預測測試圖像中該類示例的存在/不存在；
（2）檢測：從測試圖像中的 20 個目標類別中預測每個對象的邊界框和標簽；

分割

（1）分割：生成逐像素分割，給出在每個像素處可見的對象類別，否則為“背景” ；

VOC 2012 文件夾介紹

VOC 2012 文件夾下一共包括 5 個子文件夾

1）Annotations

文件為 XML格式的圖片標注信息

以其中一個為例：

里面包含的信息有：圖像數(shù)據(jù)的名稱、地址，目標的種類、位置等；

2）ImageSets

ImageSets 下有 4 個子文件夾

train.txt：訓練集相關數(shù)據(jù)
val.txt：驗證集相關數(shù)據(jù)
trainval.txt：訓練集與驗證集合并后的相關數(shù)據(jù)

Action

1、Action：與人體動作相關的數(shù)據(jù)，包括三個部分（train.txt、trainval.txt、val.txt），對應的動作有 jumping、phoning 等；

用于 人體動作分類競賽 （Action Classification Competition）

Layout

2、Layout：與人體部位相關的數(shù)據(jù)，包括三個部分（train.txt、trainval.txt、val.txt），對應的部位有 head、hand、feet 等；

用于 人體部位檢測競賽 （Person Layout Taster Competition）

Main

3、Main：與目標檢測相關的數(shù)據(jù)，包括三個部分（train.txt、trainval.txt、val.txt），一共包括 20 個類別；

用于 圖像分類 / 檢測競賽 （Classification/Detection Competitions）

Segmentation

4、Segmentation：與圖像分割相關的數(shù)據(jù)，包括三個部分（train.txt、trainval.txt、val.txt）

用于 圖像分割競賽 （Segmentation Competition）

3）JPEGImages

VOC 2012 數(shù)據(jù)集提供的所有的 .jpg 格式的圖片，訓練集和測試集一共 17125 張；

命名格式：“年份_編號.jpg”，與 1）Annotations 中的標簽相對應，圖片的像素尺寸不相同；

4）SegmentationClass

語義分割標注掩模圖，一共 2913 張；

5）SegmentationObject

實例分割標注掩模圖，一共 2913 張；

以其中一張 2007_000129.jpg 為例，將 原始圖像 、語義分割圖像 、實例分割圖像 放在一起進行比較：

原始圖像(JPEGImages) ：數(shù)據(jù)標簽都存放在 Annotations 文檔內(nèi) ；

語義分割圖像(SegmentationClass) ：同一物體類別顏色一樣，不同物體類別顏色不同；

實例分割圖像 (SegmentationObject) ：同一物體類別和不同物體類別顏色都不同；

2007_000129.jpg 對應的 Annotations 文件：

<size>：圖片尺寸 width、height、depth ；

<name> ：目標名稱，對應著 bicycle、person ；

<pose> ：拍攝角度

<truncated> ：目標檢測框是否被截斷（1為是，0為否）；

<difficult> ：目標是否難以識別（1為是，0為否）；

<bndbox> ：bounding box 目標框的位置，對應著左上角和右下角的兩個坐標；

總結

以上是生活随笔為你收集整理的[ 数据集 ] VOC 2012 数据集介绍的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

数据
VOC

上一篇： ChIPQC——对ChIP-seq的质量
下一篇：群晖3617可以有几个网卡_一步到位，购