2018年11月15日

摘要: 一:梯度下降: 梯度下降本质上是对极小值的无限逼近。先求得梯度,再取其反方向,以定步长在此方向上走一步,下次计算则从此点开始,一步步接近极小值。需要注意的是步长的取值,如果过小,则需要多次迭代,耗费大量时间才能取得极小值;如果过大,则可能难以取得较为接近极小值的点,在极小值两边来回跳跃,无法接近极小 阅读全文

posted @ 2018-11-15 17:43 岚月 阅读(621) 评论(0) 推荐(0)