MobileNet

深度可卷积网络:

  1. depthwise convolution
  2. pointwise convolution

两个超参数:

  1. width multiplier: 改变每层输入/输出 channel 的数量,影响参数数量和计算时间
  2. resolution multiplier: 改变输入图像的解析度大小,只影响计算时间

notice!!! 论文指出在相似的计算量和参数数量情况下,模型变窄(channel 数变少)比模型变浅性能要好

网络结构:

  1. 第一层为全卷积
  2. 除了最后一层全连接层不经过非线性函数(relu), 其它层之后都跟着 batchnorm + ReLU
  3. downsampling 是通过调节 depthwise convolution(以及第一层) 的 stride 来实现
  4. 在最后一层全连接层之前为 global average pooling

-w166

总体网络结构

屏幕快照 2018-03-16 下午10.28.10-w396

计算时间和参数数量

屏幕快照 2018-03-16 下午10.27.50-w340

posted @ 2018-08-23 20:47  nowgood  阅读(230)  评论(1)    收藏  举报