深度学习

概念,解释,填空

  1. BP算法(误差反向传播算法):
    通过 链式法则 反向推导误差,计算模型参数的梯度,从而指导参数优化,最小化预测与真实值的误差的一种训练神经网络的核心算法
  2. 构建高性能机器学习模型的重要步骤(数据预处理,数据增强)
  3. 数据预处理(将原始数据转化为干净,标准化,适合模型输入的格式)
    • 原始数据:杂乱的,不完整的,不一致的,或者包含噪声
    • 直接用原始数据训练模型会使得模型性能下降,导致无法训练
    • 数据预处理:将原始数据输入到机器学习模型之前,对其进行清洗,转换,归一化和格式化等操作过程
    • 数据清洗:处理缺失值,异常值,重复值(识别,移除,修改,转换,修正填充)
  4. 数据增强(通过引入更多变体来扩充数据集,提高模型的泛化能力和健壮性)
    • 数据增强::一种扩充数据集的技术,通过对现有数据进行一系列的变换操作,生成新的但仍然具有代表性的数据样本。
    • 几何变换(翻转,旋转,平移,错切,缩放,裁剪)
      • 错切:沿着一个轴向拉伸图像,使其看起来倾斜
    • 颜色变换(亮度,对比度,饱和度,色相调整)
    • 添加噪音(高斯噪音,椒盐噪音)
      • 高斯噪音:向图像中添加随机噪声点
      • 椒盐噪音: 随机将像素设为黑色或白色。
  5. 算力:GPU 显存越大,速度越快
  6. 损失函数:
    • 作用:量化模型预测(y^ )与真实标签(y)的差异,为参数优化提供目标(最小化损失)
    • 如何算:

    确定任务类型:回归(预测连续值,如房价)、分类(预测类别,如猫狗)、序列任务(如 NLP)等。
    选择对应损失函数:根据任务和模型输出形式(概率、数值等)。
    代入预测值和真实值:按公式计算单个样本或批量样本的损失。

  7. 激活函数:
    • 目的:为了解决很多线性不可分的分类问题,M-P模型引入非线性变换,通过曲线分割空间。
    • 为什么:引入非线性,生物模拟,分类能力
    • 常见激活函数(Sigmoid 输出(0,1)适合二分类,ReLU 输出max(0,x)缓解梯度消失,计算高效)
  8. 梯度下降算法:
    • 梯度:指向函数值在某一点增长最快方向的一个向量
    • 梯度下降:沿着梯度的反方向更新参数,以此最小化损失函数
    • 梯度(grad)的计算:
      alt text

卷积(计算方式):[Cin, Cout, k, p, s] (H_{out} = \frac{H_{in} - k + 2p}{s} + 1)→ 计算过程.池化,归一化操作(47) p 归一化干什么,什么数据.最大平均,随机池化.(nn. 数据增强(旋转,平移).RN(?). 三种表示方式

计算,理解

为什么引入激活函数?

答:

  1. 引入非线性:若仅用线性变换,多层网络等价于单层,无法拟合复杂数据(如图像中的曲线边界)
  2. 生物模拟:模仿神经元的非线性激活特性(如生物神经元的放电阈值)
  3. 分类能力:非线性激活使网络能划分非线性决策边界(如异或问题需曲线分割)

用 LSTM 预测股票走势时,如何处理数据中的异常值?
答:
使用 IQR 法检测异常值(Q3+1.5IQR 以上视为异常);
删除异常值或用中位数填充;
数据增强(如随机翻转、平移)提升模型鲁棒性。

为什么深度学习需要多层网络?​

答:​
① 多层网络通过分层特征提取,从原始数据(如像素)逐步学习抽象语义(如边缘→物体→场景);​
② 单层网络仅能拟合线性关系,多层非线性变换可处理复杂数据分布(如曲线决策边界)。

posted @ 2025-06-26 17:34  GJ504b  阅读(10)  评论(0)    收藏  举报