摘要: 1、问题描述:开始训练一切都是那么的平静,很正常! 突然loss变为nan,瞬间懵逼! 2、在网上看了一些解答,可能是梯度爆炸,可能是有关于0的计算。然后我觉得可能是关于0的吧,然后进行了验证。 3、验证方法:因为我使用的是softmax loss, 我直接打印每一步的输出向量中的最大值即: 发现最 阅读全文
posted @ 2019-05-10 15:59 青牛梦旅行 阅读(3239) 评论(0) 推荐(0)