摘要: adam 参数解析 参考 https://zhuanlan.zhihu.com/p/91166049 https://zhuanlan.zhihu.com/p/32626442 伪代码 参数解释 Mt Mt 提供了需要增大学习率的参数加速训练的能力. *. 累计的一阶动量(梯度)越大 代表在这个方向 阅读全文
posted @ 2020-09-03 20:39 bugfree 阅读(4576) 评论(0) 推荐(0)