test

RFCN Region Based Fully Connect Network

问题

  • 图像分类中的平移不变性(要求)
  • 目标检测中的平移变换性(要求)

补充FCN

FCN :全卷积神经网络,去掉CNN最后的全连接层, 从特征中恢复每个像素所属类别(常用于语义分割, 相当于对每个像素进行分类, 用1*1卷积核,即所有像素共用一个分类器)

流程: heatmap -> 反卷积回原图尺寸 -> 1*1卷积核对像素进行分类


感受野计算公式

$$
l_k=l_{k-1}+(f_k-1)\prod_{i=1}^{k-1}s_i
$$
即第k层感受野等于第k-1层的感受野加上jump
(本层的kernelsize-1), jump是之前层的步长的乘积


补充各种卷积方法

  • 空洞卷积dilate conv, 或者扩张卷积

    img

保证卷积核参数不变情况下增加感受野,dilate rate即是kernel之间间隔数量 正常的卷积dilate rate=1

  • deconv 或者 transpose conv 转置卷积只能还愿shape 不能还愿value

    input=$\left[ \begin{matrix} x_1 & x_2 & .. & x_4\ .& . &.&. \ .& . &.&. \ .& . &.& x_{16} \\end{matrix}\right]$

    img2

    即进行转置卷积肯定会有padding(即加入的padding使得输出和正常的卷积输入相同)

    i=4, s=1, k=3, $o=\lfloor \frac{i-k+2p}{s} \rfloor+1=2$

    i=2, s=1, k=3, $o=s*(o-1)+k=4$, 在实际实现中需要加入padding(这部分不计入padding)

    记y=Cx, C, x为卷积核, 输入(调整为矩阵形式后的)则

    $\frac{\partial Loss}{\partial x}=\frac{\partial Loss}{\partial y}*\frac{\partial y}{\partial x}=\frac{\partial Loss}{\partial y}{4\times1} \cdot CT=CT \cdot \frac{\partial Loss}{\partial y}$

    即正向时左乘C, 反向时右乘$C^T$, 转置卷积是正向左乘$C^T$, 反向时右乘C,因此得名转置卷积

posted @ 2019-02-23 20:07  mrsihao  阅读(108)  评论(0)    收藏  举报