ImageNet历年冠军和相关CNN模型

ImageNet

是一个超过15 million的图像数据集，大约有22,000类。
是由李飞飞团队从2007年开始，耗费大量人力，通过各种方式（网络抓取，人工标注，亚马逊众包平台）收集制作而成，它作为论文在CVPR-2009发布。当时人们还很怀疑通过更多数据就能改进算法的看法。
深度学习发展起来有几个关键的因素，一个就是庞大的数据（比如说ImageNet），一个是GPU的出现。（还有更优的深度模型，更好的优化算法，可以说数据和GPU推动了这些的产生，这些产生继续推动深度学习的发展）。

ILSVRC

是一个比赛，全称是ImageNet Large-Scale Visual Recognition Challenge，平常说的ImageNet比赛指的是这个比赛。
使用的数据集是ImageNet数据集的一个子集，一般说的ImageNet（数据集）实际上指的是ImageNet的这个子集，总共有1000类，每类大约有1000张图像。具体地，有大约1.2 million的训练集，5万验证集，15万测试集。
ILSVRC从2010年开始举办，到2017年是最后一届。ILSVRC-2012的数据集被用在2012-2014年的挑战赛中（VGG论文中提到）。ILSVRC-2010是唯一提供了test set的一年。
ImageNet可能是指整个数据集（15 million），也可能指比赛用的那个子集（1000类，大约每类1000张），也可能指ILSVRC这个比赛。需要根据语境自行判断。
12-15年期间在ImageNet比赛上提出了一些经典网络，比如AlexNet，ZFNet，OverFeat，VGG，Inception，ResNet。我在CNN经典结构1中做了相应介绍。
16年之后也有一些经典网络，比如WideResNet，FractalNet，DenseNet，ResNeXt，DPN，SENet。我在CNN经典结构2中做了相应介绍。

ImageNet的分类结果（加粗为冠军）

年	网络/队名	val top-1	val top-5	test top-5	备注
2012	AlexNet	38.1%	16.4%	16.42%	5 CNNs
2012	AlexNet	36.7%	15.4%	15.32%	7CNNs。用了2011年的数据
2013	OverFeat			14.18%	7 fast models
2013	OverFeat			13.6%	赛后。7 big models
2013	ZFNet			13.51%	ZFNet论文上的结果是14.8
2013	Clarifai			11.74%
2013	Clarifai			11.20%	用了2011年的数据
2014	VGG			7.32%	7 nets, dense eval
2014	VGG（亚军）	23.7%	6.8%	6.8%	赛后。2 nets
2014	GoogleNet v1			6.67%	7 nets, 144 crops
	GoogleNet v2	20.1%	4.9%	4.82%	赛后。6 nets, 144 crops
	GoogleNet v3	17.2%	3.58%		赛后。4 nets, 144 crops
	GoogleNet v4	16.5%	3.1%	3.08%	赛后。v4+Inception-Res-v2
2015	ResNet			3.57%	6 models
2016	Trimps-Soushen			2.99%	公安三所
2016	ResNeXt（亚军）			3.03%	加州大学圣地亚哥分校
2017	SENet			2.25%	Momenta 与牛津大学

ImageNet的定位结果（加粗为冠军）

年	网络/队名	val top-5	test top-5	备注
2012	AlexNet		34.19%	多伦多大学Hinton和他学生
2012	AlexNet		33.55%	用了2011年的数据
2013	OverFeat	30.0%	29.87%	纽约大学Lecun团队
2014	GoogleNet		26.44%	谷歌
2014	VGG	26.9%	25.32%	牛津大学
2015	ResNet	8.9%	9.02%	微软
2016	Trimps-Soushen		7.71%	公安三所，以Inception, resNet, WRN等为基础
2017	DPN		6.23%	新加坡国立大学与奇虎360

ImageNet的检测结果（加粗为冠军）

年	网络/队名	mAP(%)	备注
2013	OverFeat	19.40	使用了12年的分类数据预训练
2013	UvA	22.58
2013	OverFeat	24.3	赛后。使用了12年的分类数据预训练
2014	GoogleNet	43.93	R-CNN
2015	ResNet	62.07	Faster R-CNN
2016	CUImage	66.28	商汤和港中文，以GBD-Net等为基础
2017	BDAT	73.41	南京信息工程大学和帝国理工学院

其它
HikVision（海康威视）：2016年的场景分类第一

posted @ 2018-09-08 15:02 PilgrimHui 阅读(40814) 评论(2) 收藏举报

刷新页面返回顶部

PilgrimHui