摘要: 梯度下降是一种通用的优化算法,其思想为迭代选择参数,使代价函数最小。 当描述梯度下降时,模型参数被随机初始化并反复调整以最小化代价函数;学习率与代价函数的斜率成正比,所以随着参数的逼近,学习率逐渐变小 学习率将决定迭代的次数与花费的时间 学习率太低导致迭代次数过多 学习率太高导致算法无法收敛 不是所 阅读全文
posted @ 2020-10-06 14:35 GoBetter 阅读(294) 评论(0) 推荐(0)