摘要: 0.问题确认 0.0 梯度消失 模型无法从训练数据中获得更新,损失几乎保持不变 打印梯度值,梯度值为0或者非常小,比如 -->grad_value: tensor(3.1044e-10, device='cuda:0') for name, parms in self.model.named_par 阅读全文
posted @ 2022-08-01 11:48 哈哈哈喽喽喽 阅读(236) 评论(0) 推荐(0)