摘要: 1 全梯度下降算法(FG)计算训练集所有样本误差,对其求和再取平均值作为目标函数。 权重向量沿其梯度相反的方向移动,从而使当前目标函数减少得最多。 因为在执行每次更新时,我们需要在整个数据集上计算所有的梯度,所以批梯度下降法的速度会很慢,同时,批梯度下降法无法处理超出内存容量限制的数据集。 批梯度下 阅读全文
posted @ 2021-01-25 17:12 你的深渊 阅读(157) 评论(0) 推荐(0) 编辑