这是一篇经典的论文探讨了卷积网络深度对大规模图像识别的应用,论文的主要贡献是使用3x3小卷积+提高网络深度(16-19层)来全面评估对网络精度的影响。发明了经典的网络模型VGG16、VGG19
论文在1节的introduction中介绍,随着卷积神经网络在CV领域的广泛使用,大家都在改进早期优秀的网络结构(2012年Krizhevsky等论文ImageNet Classification with Deep Convolutional Neural Networks介绍的网络),目的是取得更好的精度。例如2013年Zeiler的论文:《Visualizing and understanding convolutional neural networks》以及2014年Sermanet的论文:《OverFeat: Integrated Recognition,Localization and Detection using Convolutional Networks》,在第一个卷积层使用小的滑动窗口和小的步长。另外一个提高精度的方向是使用整张图和多尺度例如Howard在2014年的论文 《Some improvements on deep convolutional neural network based image classification》,本文作者从增加网络深度的方向提高精度,而且使用了3x3的小卷积核。
论文第2节介绍了网络结构,网络结构的搭建受到了2012年Ciresan的论文《Multi-column deep neural networks for image classification》和2012年Krizhevsky的论文《ImageNet classification with deep convolutional neural networks》的启发。
浙公网安备 33010602011771号