会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
今天看见未来
罗马不是一天建成的,但可以一天就被摧毁!!!
博客园
首页
新随笔
联系
订阅
管理
2018年10月25日
mini batch
摘要: 转载于https://testerhome.com/topics/10877 回顾 之前我们讲到了一些在训练模型的时候用到的超参数,例如上一次说的L2 正则, 在过拟合的场景中增加L2的值有助于减小网络的复杂度。 还有诸如学习率, 在梯度下降中,每一次迭代的下降的步长是学习率乘以成本函数对w的导数。
阅读全文
posted @ 2018-10-25 10:33 今天看见未来
阅读(974)
评论(0)
推荐(0)
公告