损失函数:loss = ∑i(w*x + b - yi)2
对于凸函数,有专门的方法可以凸优化,即使是非凸函数也可以使用。
随机梯度算法的目的就是使顺势函数最小化,目前一般使用Adam算法。
Logistic Regression 和 Linear Regression的区别在于加了一个激活函数(sigmoid,ReLu....),使数据分布在0到1之间。