摘要:1. Learning rate不合适,如果太大,会造成不收敛,如果太小,会造成收敛速度非常慢; 2. Batch size太大,陷入到局部最优; 3. 网络太简单,一般情况下,网络的层数和节点数量越大,拟合能力就越强,如果层数和节点不够多,无法拟合复杂的数据,也会造成不收敛. 阅读全文
posted @ 2019-08-20 01:21 MSTK 阅读(2089) 评论(0) 推荐(0) 编辑