机器学习课程笔记 3
上一篇 -> 机器学习课程笔记 2。
第3讲 卷积神经网络 CNN
- 对于不同学习任务来说,图像并不是所有的信息都有用,所以 CNN 选择特征时使用不同大小的感受野去提取特征信息。


3.1 卷积层(感受野 + 参数共享)
- 感受野就是要对图像进行提取特征的那部分视野。
- 还需涉及其他概念
- kernel_size 卷积核大小
- padding 用于滑动时填充空缺
- stride 卷积核滑动的步幅大小
- channel 图片具有的通道数
- 卷积 卷积核与图片的像素值相乘相加得到新像素值

- 需要学习的参数是卷积核里的值, 也通过这种方式共享参数。
3.2 池化层 Pooling Layer
多用于减少计算
- 最大池化
感受野内选择最大的一个作为新像素值 - 平均池化
感受野内所有像素值的平均值作为新像素值
3.3 总体流程
- 卷积层和池化层穿插
- Flatten拉直后进入全连接层
- 或许还需要 softmax 分类


3.4 扩展 Spatial Transformer Layer
- 还是上述的问题: CNN对切割和旋转敏感。
- 可以通过对图像进行增强(旋转、切割、缩放)后进行训练。
- 也可以通过隐藏层参数实现(Spatial Transformer Layer)。


浙公网安备 33010602011771号