摘要: 通常为了模型能更好的收敛,随着训练的进行,希望能够减小学习率,以使得模型能够更好地收敛,找到loss最低的那个点. tensorflow中提供了多种学习率的调整方式.在搜索decay.可以看到有多种学习率的衰减策略. cosine_decay exponential_decay inverse_ti 阅读全文
posted @ 2019-11-19 10:26 core! 阅读(3815) 评论(0) 推荐(0)