摘要: 首先梯度下降算法一共有三个变形:BGD, SGD , MBGD, 这三种形式的区别就是取决于我们用多少数据来计算目标函数的梯度. 1.BGD(Batch gradient descent) BGD 采用整个训练集的数据来执行一次更新: for i in range(nb_epochs ): para 阅读全文
posted @ 2019-01-05 13:37 hou永胜 阅读(559) 评论(0) 推荐(0)