Transposed Convolution, Fractionally Strided Convolution or Deconvolution

Transposed Convolution, Fractionally Strided Convolution or Deconvolution

反卷积（Deconvolution）的概念第一次出现是Zeiler在2010年发表的论文Deconvolutional networks中，但是并没有指定反卷积这个名字，反卷积这个术语正式的使用是在其之后的工作中(Adaptive deconvolutional networks for mid and high level feature learning)。随着反卷积在神经网络可视化上的成功应用，其被越来越多的工作所采纳比如：场景分割、生成模型等。其中反卷积（Deconvolution）也有很多其他的叫法，比如：Transposed Convolution，Fractional Strided Convolution等等。

这篇文章的目的主要有两方面：
1. 解释卷积层和反卷积层之间的关系；
2. 弄清楚反卷积层输入特征大小和输出特征大小之间的关系。

## 卷积层

卷积层大家应该都很熟悉了,为了方便说明，定义如下：
- 二维的离散卷积（ $N = 2$

下图表示参数为 $(i = 6, k = 3, s = 2, p = 1)$

从上述两个例子我们可以总结出卷积层输入特征与输出特征尺寸和卷积核参数的关系为：

o = ⌊ i + 2 p - k s ⌋ + 1.

$N = 2$

反卷积层

在介绍反卷积之前，我们先来看看卷积运算和矩阵运算之间的关系。

卷积和矩阵相乘

考虑如下一个简单的卷积层运算，其参数为 $(i = 4, k = 3, s = 1, p = 0)$

对于上述卷积运算，我们把上图所示的3×3卷积核展成一个如下所示的[4,16]的稀疏矩阵 $C$

⎛⎝⎜⎜⎜⎜ w 0, 0 0 0 0 w 0, 1 w 0, 000

我们再把4×4的输入特征展成[16,1]的矩阵 $X$

通过上述的分析，我们已经知道卷积层的前向操作可以表示为和矩阵 $C$

反卷积和卷积的关系

全面我们已经说过反卷积又被称为Transposed(转置) Convolution，我们可以看出其实卷积层的前向传播过程就是反卷积层的反向传播过程，卷积层的反向传播过程就是反卷积层的前向传播过程。因为卷积层的前向反向计算分别为乘 $C$

下图表示一个和上图卷积计算对应的反卷积操作，其中他们的输入输出关系正好相反。如果不考虑通道以卷积运算的反向运算来计算反卷积运算的话，我们还可以通过离散卷积的方法来求反卷积（这里只是为了说明，实际工作中不会这么做）。

同样为了说明，定义反卷积操作参数如下：

二维的离散卷积（ $N = 2$
方形的特征输入（ $i_{1}^{'} = i_{2}^{'} = i^{'}$
方形的卷积核尺寸（ $k_{1}^{'} = k_{2}^{'} = k^{'}$
每个维度相同的步长（ $s_{1}^{'} = s_{2}^{'} = s^{'}$
每个维度相同的padding ( $p_{1}^{'} = p_{2}^{'} = p^{'}$

下图表示的是参数为( $i^{'} = 2, k^{'} = 3, s^{'} = 1, p^{'} = 2$

o' = i' - k' + 2 p' + 1 = i' + (k - 1) - 2 p

Fractionally Strided Convolution

上面也提到过反卷积有时候也被叫做Fractionally Strided Convolution，翻译过来大概意思就是小数步长的卷积。对于步长 $s > 1$

o' = s (i' - 1) + k - 2 p

参考

conv_arithmetic

Is the deconvolution layer the same as a convolutional layer?

posted @ 2017-05-16 11:04 菜鸡一枚阅读(190) 评论(0) 收藏举报

刷新页面返回顶部