Pascal VOC 数据集格式
Pascal VOC 数据集格式是目标检测任务中常用的一种数据组织方式。它不仅包含图像文件,还包含与之对应的标注文件(通常是 XML 格式),用于描述图像中目标的位置和类别。以下是 Pascal VOC 数据集格式的详细说明:
数据集结构
Pascal VOC 数据集通常具有以下目录结构:
/VOCdevkit
/VOC2007
/Annotations
000001.xml
000002.xml
...
/JPEGImages
000001.jpg
000002.jpg
...
/ImageSets
/Main
train.txt
val.txt
trainval.txt
test.txt
1. Annotations
-
内容:存放标注文件,通常是 XML 格式。
-
文件名:与对应的图像文件名相同,但扩展名为
.xml。 -
格式:每个 XML 文件包含图像中所有目标的标注信息。以下是一个示例 XML 文件的内容:
xml
<annotation>
<folder>VOC2007</folder>
<filename>000001.jpg</filename>
<source>
<database>The VOC2007 Database</database>
<annotation>PASCAL VOC2007</annotation>
<image>flickr</image>
</source>
<size>
<width>353</width>
<height>500</height>
<depth>3</depth>
</size>
<segmented>0</segmented>
<object>
<name>dog</name>
<pose>Unspecified</pose>
<truncated>1</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>48</xmin>
<ymin>240</ymin>
<xmax>195</xmax>
<ymax>371</ymax>
</bndbox>
</object>
<object>
<name>cat</name>
<pose>Unspecified</pose>
<truncated>1</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>8</xmin>
<ymin>12</ymin>
<xmax>352</xmax>
<ymax>498