最小值:梯度下降;最大值:梯度上升

(1)批量梯度下降---最小化所有训练样本的损失函数,使得最终求解的是全局的最优解,即求解的参数是使得风险函数最小。

(2)随机梯度下降---最小化每条样本的损失函数,虽然不是每次迭代得到的损失函数都向着全局最优方向, 但是大的整体的方向是向全局最优解的,最终的结果往往是在全局最优解附近。

 

让theta(j)沿梯度下降最快的方向变化,批量梯度下降对多个样本梯度去均值;

梯度下降:

http://blog.csdn.net/acdreamers/article/details/27660519

相关表达式:

批量梯度下降:

http://blog.csdn.net/lilyth_lilyth/article/details/8973972

相关表达式:

 

posted on 2014-09-14 14:52  CT1104  阅读(275)  评论(0编辑  收藏  举报