深度学习调参笔记(trick)
摘要:1. Adam 学习率0.00035真香; 2. SGD + Momentum 学习率应当找到合适区间,一般远大于Adam (取1,2,5,10这类数据); 3. 提前终止,防止过拟合; 4. Ensemble可以显著提高模型性能,对两个模型而言,适当增加性能较好的模型权重可能会取得更好的结果; 5
阅读全文
posted @ 2020-03-16 08:49
上海交通大学CS博士生
posted @ 2020-03-16 08:49
posted @ 2020-03-07 19:29
posted @ 2020-03-01 16:47