跑caffe过程中的备忘

1*1卷积比如一张500*500且厚度depth为100的图片在20个filter上做1*1卷积,那么结果大小为500*500*20

只有池化改变图片的大小 

一个大的全连接层可以理解为一个神经网络,这个NN 中的神经元连接着前一层的每一个输入 ,所以最后一层数据被延展为一个巨大 的列向量。

卷积的过程是一个逐渐抽象化的过程,到最后得到一个数据块

在每个卷积层中,数据都是以三维的形式存在的。你可以吧它看成很多二维图片叠在一起,其中每一个称为一个feature map。在输入层,如果是灰度图片,那就只有一个feature map;如果是彩色图片,一般就是3个feature map(红绿蓝)。

32*32*3 image 是指的height,width,depth,深度不是神经网络的深度,深度是指图像有三个通道

上海科技大学的多列卷积神经网络的单张图像的r人群计数算法,其中的多列卷积神经网络有三个子网络,每个子网络用到卷积核的大小不同,每个子网络的输入为同一张图像,在经过四次卷积和两次池化后,三个子网络输出的特征图在“通道”维度上链接在一起,再用一个1×1的核卷积得到人群的密度图。本发明得到的人群密度优于现有算法。
1> 多列架构的原因是:三列对应于不同大小的感受野(大,中,小),使每个列卷积神经网络的功能对由于透视或不同的图像分辨率造成的人/头大小变化是自适应的(因此,整体网络是强大的)。

2> 用一个1*1滤波器的卷积层代替了完全连接的层,因此模型的输入图像可以是任意大小的,避免了失真。网络的直接输出是一个人群密度估计图,从中可以得到的整体计数。

 在图像范围内滑动这个卷积核,形成激活图,激活图给出了每个空间位置处卷积核的反应

在训练阶段,不需要accuracy层,但是在验证阶段,是需要的

 

one filter产生一个activation map

 

posted @ 2017-09-18 16:07  女王公园的八神  阅读(140)  评论(0编辑  收藏  举报