摘要: C6 与学习相关 1、参数的更新①参数的最优化:找到使得损失函数值尽可能小的参数SGD:随机梯度下降法,醉着梯度方向更新参数缺点:如果函数形状非均向,呈延伸状,搜索的路径就会非常低效 momentum:动量引入一个v初始化时,v什么都不保存当第一次调用update()时,v会以字典型变量形式保存参数 阅读全文
posted @ 2020-08-26 18:15 土星狗蛋 阅读(157) 评论(0) 推荐(0)