每日论文7.24——基于全卷积神经网络的OCT内外指纹提取算法

一、神经网络核心结构与概念

1. 基础连接与特征提取

  • 全连接 vs 局部连接
    • 全连接:每个神经元与前一层所有输入相连,参数多(适用于简单分类,但不适合图像)。
    • 局部连接:神经元仅连接前一层局部区域(局部感受野),利用图像局部相关性,大幅减少参数(CNN 基础)。
  • 局部感受野
    神经元 “关注” 的输入局部区域(如 3×3 像素),模拟人类视觉对局部特征的感知(如边缘、纹理)。
  • 卷积核
    提取特征的小矩阵(如 3×3),通过滑动扫描图像、卷积运算(对应位置相乘求和)提取边缘、纹理等特征,且参数共享(同一卷积核扫全图,减少参数)。
  • 参数共享
    卷积核在扫描图像时复用同一套权重,避免为每个位置设计独立参数(如 3×3 卷积核仅 9 个参数,而非位置数 ×9),是 CNN 高效的核心。

2. 网络层与操作

  • 池化层
    • 作用:对特征图降维(压缩尺寸),保留核心特征,减少参数和过拟合。
    • 类型:
      • 最大池化:取窗口最大值,保留局部强特征(如边缘)。
      • 均值池化:取窗口平均值,保留整体趋势(如色块)。
  • 激活函数
    • 作用:注入非线性能力,使网络学习复杂模式(无激活函数则为线性模型)。
    • 常用类型:
      • ReLU:隐藏层首选(计算快,缓解梯度消失)。
      • Sigmoid:二分类输出层(输出 0~1 概率)。
      • Softmax:多分类输出层(输出概率分布)。

3. 经典网络架构

  • 全卷积神经网络(FCN)
    • 特点:用卷积层替代全连接层,支持任意尺寸输入,输出像素级预测(如语义分割)。
    • 结构:下采样(提取特征)→ 卷积化(替代全连接)→ 上采样(恢复尺寸)。
  • U-Net
    • 特点:U 型结构(编码器 + 解码器 + 跳跃连接),高精度分割(尤其医学影像)。
    • 优势:跳跃连接融合浅层细节与深层语义,对称结构保细节。
  • 残差卷积神经网络(ResNet)
    • 核心:残差连接(输出 = 输入 + 残差),解决深层网络梯度消失和性能退化。
    • 应用:图像分类、目标检测(作为骨干网络)。
  • 卷积 LSTM(ConvLSTM)
    • 特点:卷积 + LSTM 结合,处理时空数据(如视频、气象序列)。
    • 优势:同时捕捉空间局部特征(卷积)和时序依赖(LSTM)。

二、传统图像处理算法

1. BM3D 图像滤波

  • 核心:基于非局部相似性,将相似 2D 块堆叠为 3D 块,通过 3D 变换滤波去噪。
  • 优势:去噪强且保细节(尤其高斯噪声),适用于医学影像、遥感图像。

2. Retinex 算法

  • 核心:分解图像为反射分量(物体固有属性)和光照分量(环境光),增强反射分量。
  • 类型:单尺度(SSR)、多尺度(MSR)、带颜色恢复(MSRCR,适用于低光照增强)。

三、核心逻辑总结

类别核心目标典型应用场景
神经网络基础 提取特征、减少参数、学习非线性模式 图像分类、目标检测
分割网络(FCN/U-Net) 像素级预测,保留空间细节 语义分割、医学影像分割
残差网络 / ConvLSTM 深层特征提取、时空数据处理 超深分类、视频预测
传统滤波 / 增强算法 去噪、提升对比度,基于物理 / 视觉模型 医学影像去噪、低光照增强
posted @ 2025-07-24 21:43  伟大的船长  阅读(22)  评论(0)    收藏  举报