摘要:本文简单介绍了 Adam 优化器,并讨论一个问题:Adam 这个自适应学习率的优化器还有必要使用学习率衰减(learning rate decay)吗? 阅读全文
posted @ 2019-06-28 17:06 wuliytTaotao 阅读(27978) 评论(1) 推荐(4) 编辑