摘要: 在小批量梯度下降中,试分析为什么学习率要和批量大小成正比 在标准的梯度下降中,参数的更新公式是: θ=θ−η∇θJL(θ)\theta = \theta - \eta \nabla_\theta JL(\theta)θ=θ−η∇θ​JL(θ) 其中,η\etaη 是学习率,∇θJL(θ)\nabla 阅读全文
posted @ 2023-10-01 22:31 我记得 阅读(35) 评论(0) 推荐(0) 编辑