感受野

定义: 卷积神经网络每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小。

-w360

设网络共有 N 层卷积层, 卷积核采用正方形, 记第 i 层卷积核大小为 \(size_i\), 步长为 \(stride_i\), 当我们计算 \(feature \space map\) 经过第 N 层卷积(或者池化), 输出的一个 "像素"对应的感受野时, 计算过程如下(从上到下计算, 计算最后所得值就是对应的感受野), \(field_{N}\) 表示经过第 N 层卷积之后的 feature map 上一个像素点对应的感受野(只看宽度).

\[\begin {align*} &field_{N} = size_N \\ &\quad \quad \vdots \\ &field_{i} = (field_{i+1} - 1) \times stride_{i} + size_i \\ &\quad \quad \vdots \\ &field_{1} = (field_{2} - 1) \times stride_{1} + size_1\\ \end {align*} \]

\(field_{1}\) 即为所求感受野.

\(\color{red}{举例如下(\bf ZFNet)}\):

第 8 层为最后一个 feature map 大小为 13x13 这一层, 171 为该层 3 个像素在图片的感受野大小

layer size stride 计算
8th 3 1 3
7th 3 1 (3-1)×1 + 3 = 5
6th 3 1 (5-1)×1 + 3 = 7
5th 3 1 (7-1)×1 + 3 = 9
4th 3 2 (9-1)×2 + 3 = 19
3rd 5 2 (19-1)×2 + 5 = 41
2nd 3 2 (41-1)×2 + 3 = 83
1st 7 2 (83-1)×2 + 2 = 171
posted @ 2018-03-30 18:59  nowgood  阅读(1756)  评论(0编辑  收藏  举报