机器学习课程笔记 3

上一篇 -> 机器学习课程笔记 2。

第3讲 卷积神经网络 CNN

  • 对于不同学习任务来说,图像并不是所有的信息都有用,所以 CNN 选择特征时使用不同大小的感受野去提取特征信息。

image

image

3.1 卷积层(感受野 + 参数共享)

  • 感受野就是要对图像进行提取特征的那部分视野。
  • 还需涉及其他概念
    • kernel_size 卷积核大小
    • padding 用于滑动时填充空缺
    • stride 卷积核滑动的步幅大小
    • channel 图片具有的通道数
    • 卷积 卷积核与图片的像素值相乘相加得到新像素值

image

  • 需要学习的参数是卷积核里的值, 也通过这种方式共享参数。

3.2 池化层 Pooling Layer

多用于减少计算

  • 最大池化
    感受野内选择最大的一个作为新像素值
  • 平均池化
    感受野内所有像素值的平均值作为新像素值

3.3 总体流程

  • 卷积层和池化层穿插
  • Flatten拉直后进入全连接层
  • 或许还需要 softmax 分类

image

image

3.4 扩展 Spatial Transformer Layer

  • 还是上述的问题: CNN对切割和旋转敏感。
  • 可以通过对图像进行增强(旋转、切割、缩放)后进行训练。
  • 也可以通过隐藏层参数实现(Spatial Transformer Layer)。

image

下一篇 -> 机器学习课程笔记 4。

posted @ 2022-10-07 18:14  bok_tech  阅读(33)  评论(0)    收藏  举报