摘要: 这节课的推导真心hold不住了。按照自己的理解记下仅看明白的东西吧。或许还有第二遍、第三遍整理呢。 主要讲了两个问题: 学习率α如何确定? 使用固定的学习率还是变化的学习率? 学习率设置为多大比较好? 下降的方向如何处理,除了梯度方向,有没有其他方向? 可行方向和梯度方向有何关系? 先上结论: 使用 阅读全文
posted @ 2016-10-10 11:58 xubling 阅读(247) 评论(0) 推荐(0)