摘要: 动量是指在原来的梯度下降基础上,将现在的梯度方向与历史梯度方向融合,根据超参数调节权值,让梯度更缓和并且有可能跳出局部极小值 代码实现: 学习率的动态改变: Dropout 丢弃一些参数,简化模型,减轻过拟合: 因为训练时才需要dropout,所以要区分train还是test(val也属于test) 阅读全文
posted @ 2020-09-20 22:09 山…隹 阅读(813) 评论(0) 推荐(0)