为啥要使用梯度下降法
求最大值最小值的两种主流方法:

将导致设置为0当然是最简单的方法,但是有时求导之后,没法发保证左边只包含w,而右边不包含的情况,此时需要使用梯度下降法。

先随便给一个w的初始值,然后根据导函数,一步步的迭代,直到w收敛。
此时w的对应的f(w)值也越来越趋近最小值!
作者:宋桓公
出处:http://www.cnblogs.com/douzi2/
如果您觉得阅读本文对您有帮助,请点一下“推荐”按钮,您的“推荐”将是我最大的写作动力!欢迎各位转载,但是未经作者本人同意,转载文章之后必须在文章页面明显位置给出作者和原文连接,否则保留追究法律责任的权利。

浙公网安备 33010602011771号