2020年3月16日

摘要: 1. Adam 学习率0.00035真香; 2. SGD + Momentum 学习率应当找到合适区间,一般远大于Adam (取1,2,5,10这类数据); 3. 提前终止,防止过拟合; 4. Ensemble可以显著提高模型性能,对两个模型而言,适当增加性能较好的模型权重可能会取得更好的结果; 5 阅读全文
posted @ 2020-03-16 08:49 穷酸秀才大草包 阅读(630) 评论(0) 推荐(0)

导航