0629 每日文献阅读 打卡

Read Data: 0629

Publication: ECCV 2014

Title: Visualizing and Understanding Convolutional Networks

Participants: Matthew D. Zeiler ; Rob Fergus

Aim:

为了解决卷积网络的可视性以及可解释性,如何才能得到提高。

Research Question:

论文主要使用反卷积(Deconvolutionnal Network),将feature map映射为输入图像的大小,论文还对图像进行了局部遮挡分析,观察图像哪些部分对神经网络分类至关重要。改进了AlexNet,提出了超过它性能的模型。

Method:

模型提出的方法:将输入图像呈现给卷积神经网络,并通过各层计算出特征。为了检查给定的激活层,我们将该层中的所有其他激活设置为0,并将特征映射作为输入传递给附加的反卷积层。我们依次(i)反池化,(ii)反激活层,以重构产生所选激活的层下的活动。重复此操作,直到恢复原始像素的大小

Results:

通过可视化可以得到,我们提取的是关键的信息。浅层提取的的低级特征,而深层提取的是复杂的特征比如网格纹理,关键特征。

在学习过程中,随着epoch的变化,在高层训练变化较大。

对于缩放、平移等操作:对网络的第一层影响比较大,到了后面几层,基本上这些变换提取到的特征没什么比较大的变化。

当重新训练softmax分类器时,结果击败了目前在Caltech-101和Caltech-256数据集上的最先进的结果。

Discussion:

 

Conclusion:

这篇文献的算法,不仅可视化,而在于学习反卷积网络,如果懂得了反卷积网络,那么在以后的文献中,你会经常遇到这个算法。大部分CNN结构中,如果网络的输出是一整张图片的话,那么就需要使用到反卷积网络,比如图片语义分割、图片去模糊、可视化、图片无监督学习、图片深度估计,像这种网络的输出是一整张图片的任务,很多都有相关的文献,而且都是利用了反卷积网络。

Further:

 

Ref:

主要运用反卷积实现可视化,其中的流程:反池化——反激活——反卷积。

 

 

posted on 2021-06-29 15:03  Lf&x&my  阅读(42)  评论(0)    收藏  举报