MobileNet

深度可卷积网络：

depthwise convolution
pointwise convolution

两个超参数：

width multiplier：改变每层输入/输出 channel 的数量，影响参数数量和计算时间
resolution multiplier：改变输入图像的解析度大小，只影响计算时间

notice!!! 论文指出在相似的计算量和参数数量情况下，模型变窄（channel 数变少）比模型变浅性能要好

网络结构：

第一层为全卷积
除了最后一层全连接层不经过非线性函数(relu), 其它层之后都跟着 batchnorm + ReLU
downsampling 是通过调节 depthwise convolution（以及第一层）的 stride 来实现
在最后一层全连接层之前为 global average pooling

-w166

总体网络结构

屏幕快照 2018-03-16 下午10.28.10-w396

计算时间和参数数量

屏幕快照 2018-03-16 下午10.27.50-w340

posted @ 2018-08-23 20:47 nowgood 阅读(234) 评论(1) 收藏举报

刷新页面返回顶部