MobileNet
深度可卷积网络:
- depthwise convolution
- pointwise convolution
两个超参数:
- width multiplier: 改变每层输入/输出 channel 的数量,影响参数数量和计算时间
- resolution multiplier: 改变输入图像的解析度大小,只影响计算时间
notice!!! 论文指出在相似的计算量和参数数量情况下,模型变窄(channel 数变少)比模型变浅性能要好
网络结构:
- 第一层为全卷积
- 除了最后一层全连接层不经过非线性函数(relu), 其它层之后都跟着 batchnorm + ReLU
- downsampling 是通过调节 depthwise convolution(以及第一层) 的 stride 来实现
- 在最后一层全连接层之前为 global average pooling

总体网络结构

计算时间和参数数量