摘要:
一些caffe错误 训练时很快梯度爆炸,loss猛增至nan 如果找不到数据上的原因的话,可以怀疑caffe框架有问题,换用其它版本试试。比如我遇到的问题是在训练时使用了Accuracy层,而该层的实现代码在某次更新中GPU代码存在bug,复用了其它层的变量导致对loss的计算产生了影响。训练时去掉 阅读全文
posted @ 2018-01-10 11:00
康行天下
阅读(998)
评论(0)
推荐(0)
感谢楼主的整理,受益匪浅!
但是,在 RankNet 部分中的交叉熵损失函数的公式(4)中最后那个 O_xy,是不是搞错了,应该是 e^{O_xy}?
非常详细
我看懂的,真的!
不明觉厉