CNN
CNN = Convolutional Neural Network(卷积神经网络)
👉 一种专门用于处理具有网格结构数据(例如图像)的深度学习模型。
核心思想是通过卷积层(Convolution)自动提取特征,而不是人工设计特征。
🔹 基本结构:
-
输入层:输入图像(如 28×28×3)。
-
卷积层(Conv Layer):用卷积核(filter)扫描图像,提取局部特征。
有两个方式了解:
一、每个卷积核仅考虑一个特定领域,每个领域可能有多个卷积核(每个卷积核对应不同特征),不同领域检测同一特征的卷积核共享同一参数,stride 步长是两个领域相隔多远
二、有一组卷积核分别扫描每层图像,stride 步长是一次走的长度

-
激活层(ReLU):引入非线性,提高模型表达能力。
-
池化层(Pooling Layer):降维、提取主要特征(常见 max pooling)。
池化层不一定有,池化层的作用是降低图像的大小
-
全连接层(Fully Connected Layer):整合特征,输出分类结果。
-
输出层(Softmax):得到各类别的概率。
CNN 对于图像放大,旋转做的不好,所以训练的时候需要将训练数据进行放大变形,增加训练的覆盖面积
🔹 常见应用:
- 图像分类(如识别猫狗)
- 目标检测(如YOLO、Faster R-CNN)
- 图像分割(如U-Net)
- 视频分析、医学影像识别等
🔹 代表性模型:
- LeNet-5(最早的CNN之一)
- AlexNet(ImageNet 冠军,开创深度学习热潮)
- VGG、ResNet、Inception、EfficientNet 等

浙公网安备 33010602011771号