深度学习

概念，解释，填空

BP算法（误差反向传播算法）：
通过 链式法则 反向推导误差，计算模型参数的梯度，从而指导参数优化，最小化预测与真实值的误差的一种训练神经网络的核心算法
构建高性能机器学习模型的重要步骤（数据预处理，数据增强）
数据预处理（将原始数据转化为干净，标准化，适合模型输入的格式）
- 原始数据：杂乱的，不完整的，不一致的，或者包含噪声
- 直接用原始数据训练模型会使得模型性能下降，导致无法训练
- 数据预处理：将原始数据输入到机器学习模型之前，对其进行清洗，转换，归一化和格式化等操作过程
- 数据清洗：处理缺失值，异常值，重复值（识别，移除，修改，转换，修正填充）
数据增强（通过引入更多变体来扩充数据集，提高模型的泛化能力和健壮性）
- 数据增强：：一种扩充数据集的技术，通过对现有数据进行一系列的变换操作，生成新的但仍然具有代表性的数据样本。
- 几何变换（翻转，旋转，平移，错切，缩放，裁剪）
  - 错切：沿着一个轴向拉伸图像，使其看起来倾斜
- 颜色变换（亮度，对比度，饱和度，色相调整）
- 添加噪音（高斯噪音，椒盐噪音）
  - 高斯噪音：向图像中添加随机噪声点
  - 椒盐噪音：随机将像素设为黑色或白色。
算力：GPU 显存越大，速度越快
损失函数：
- 作用：量化模型预测（y^ ）与真实标签（y）的差异，为参数优化提供目标（最小化损失）
- 如何算：
确定任务类型：回归（预测连续值，如房价）、分类（预测类别，如猫狗）、序列任务（如 NLP）等。
选择对应损失函数：根据任务和模型输出形式（概率、数值等）。
代入预测值和真实值：按公式计算单个样本或批量样本的损失。
激活函数：
- 目的：为了解决很多线性不可分的分类问题，M-P模型引入非线性变换，通过曲线分割空间。
- 为什么：引入非线性，生物模拟，分类能力
- 常见激活函数（Sigmoid 输出(0,1)适合二分类，ReLU 输出max（0，x）缓解梯度消失，计算高效）
梯度下降算法：
- 梯度：指向函数值在某一点增长最快方向的一个向量
- 梯度下降：沿着梯度的反方向更新参数，以此最小化损失函数
- 梯度（grad）的计算：

卷积（计算方式）：[Cin, Cout, k, p, s] (H_{out} = \frac{H_{in} - k + 2p}{s} + 1)→ 计算过程.池化，归一化操作（47） p 归一化干什么，什么数据.最大平均，随机池化.（nn. 数据增强（旋转，平移）.RN（？）. 三种表示方式

计算，理解

为什么引入激活函数？

答：

引入非线性：若仅用线性变换，多层网络等价于单层，无法拟合复杂数据(如图像中的曲线边界)
生物模拟：模仿神经元的非线性激活特性（如生物神经元的放电阈值）
分类能力：非线性激活使网络能划分非线性决策边界（如异或问题需曲线分割）

用 LSTM 预测股票走势时，如何处理数据中的异常值？
答：
使用 IQR 法检测异常值（Q3+1.5IQR 以上视为异常）；
删除异常值或用中位数填充；
数据增强（如随机翻转、平移）提升模型鲁棒性。

为什么深度学习需要多层网络？

答：
① 多层网络通过分层特征提取，从原始数据（如像素）逐步学习抽象语义（如边缘→物体→场景）；
② 单层网络仅能拟合线性关系，多层非线性变换可处理复杂数据分布（如曲线决策边界）。

posted @ 2025-06-26 17:34 GJ504b 阅读(30) 评论(0) 收藏举报

刷新页面返回顶部

GJ504b