CNN

CNN = Convolutional Neural Network(卷积神经网络)

👉 一种专门用于处理具有网格结构数据(例如图像)的深度学习模型。
核心思想是通过卷积层(Convolution)自动提取特征,而不是人工设计特征。

🔹 基本结构:

  1. 输入层:输入图像(如 28×28×3)。

  2. 卷积层(Conv Layer):用卷积核(filter)扫描图像,提取局部特征。

    有两个方式了解:

    一、每个卷积核仅考虑一个特定领域,每个领域可能有多个卷积核(每个卷积核对应不同特征),不同领域检测同一特征的卷积核共享同一参数,stride 步长是两个领域相隔多远

    二、有一组卷积核分别扫描每层图像,stride 步长是一次走的长度

    image-20251024155711379

  3. 激活层(ReLU):引入非线性,提高模型表达能力。

  4. 池化层(Pooling Layer):降维、提取主要特征(常见 max pooling)。

​ 池化层不一定有,池化层的作用是降低图像的大小

  1. 全连接层(Fully Connected Layer):整合特征,输出分类结果。

  2. 输出层(Softmax):得到各类别的概率。

    CNN 对于图像放大,旋转做的不好,所以训练的时候需要将训练数据进行放大变形,增加训练的覆盖面积

🔹 常见应用:

  • 图像分类(如识别猫狗)
  • 目标检测(如YOLO、Faster R-CNN)
  • 图像分割(如U-Net)
  • 视频分析、医学影像识别等

🔹 代表性模型:

  • LeNet-5(最早的CNN之一)
  • AlexNet(ImageNet 冠军,开创深度学习热潮)
  • VGG、ResNet、Inception、EfficientNet
posted @ 2025-10-24 16:26  -一叶知秋-  阅读(17)  评论(0)    收藏  举报