会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
哈哈哈喽喽喽
博客园
首页
新随笔
联系
订阅
管理
2022年8月1日
梯度消失和梯度爆炸
摘要: 0.问题确认 0.0 梯度消失 模型无法从训练数据中获得更新,损失几乎保持不变 打印梯度值,梯度值为0或者非常小,比如 -->grad_value: tensor(3.1044e-10, device='cuda:0') for name, parms in self.model.named_par
阅读全文
posted @ 2022-08-01 11:48 哈哈哈喽喽喽
阅读(236)
评论(0)
推荐(0)
公告