【转】图像数据集介绍
1.mnist:
MNIST是一个手写数字数据库,它有60000个训练样本集和10000个测试样本集,每个样本图像的宽高为28*28。此数据集是以二进制存储的,不能直接以图像格式查看,不过很容易找到将其转换成图像格式的工具。
下载链接:http://yann.lecun.com/exdb/mnist/index.html (大约12MB)
2.cifar10:
Cifar-10由60000张32*32的RGB彩色图片构成,共10个分类。50000张训练,10000张测试(交叉验证)。这个数据集最大的特点在于将识别迁移到了普适物体,而且应用于多分类。
下载链接:http://www.cs.toronto.edu/~kriz/cifar.html (大约170MB)
3.imagenet:
Imagenet数据集有1400多万幅图片,涵盖2万多个类别;其中有超过百万的图片有明确的类别标注和图像中物体位置的标注。
下载链接:http://www.image-net.org/about-stats (大约1TB)
4.COCO:
COCO数据集由微软赞助,其对于图像的标注信息不仅有类别、位置信息,还有对图像的语义文本描述。
下载链接:http://mscoco.org/(大约40GB)
5.PASCAL VOC:
PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统。PASCAL VOC图片集包括20个目录:人类;动物(鸟、猫、牛、狗、马、羊);交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。
下载链接:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html (大约2GB)6.