深度学习工程基础

欠拟合与过拟合

欠拟合是指模型在训练集、验证集和测试集上均表现不佳的情况
过拟合是指模型在训练集上表现很好,到了验证和测试阶段就大不如意了,即模型的泛化能力很差。

解决方法:

  1. 解决欠拟合的方法:
  • 模型复杂化。
  • 增加更多的特征,使用表达能力更强的输入数据。
  • 调整参数和超参数。常用的 有学习率、学习率衰减等。
  • 增加训练数据。
  • 降低一些正则化约束,因为正则化约束是为了防止过拟合。
  • 降低batchsize,因为过大的batchsize会降低梯度的随机性,使模型陷入局部最优。
    2.解决过拟合的方法:
  • 增加训练集的数据量。
  • 使用正则化约束,常用的有L1,L2正则化。
  • 减少一些specific的特征,增加共性的特征。
  • 降低模型的复杂度,减少神经网络隐藏层的数量。
  • 使用dropout。
  • 提前结束训练。

神经网络的基本思想

用机器模拟人脑神经网络的数学模型,它由多层神经元组成,属于从输入层经过隐藏层到输出层前向传播。
三要素:权重、偏差、激活函数。

GPU相关

posted @ 2022-11-15 12:18  沐沐mu  阅读(21)  评论(0编辑  收藏  举报