摘要: GPU lost 需要重启 虽然只是治标不治本的方法 重启: # 先看下有什么重要的任务正在跑 htop # 再立即重启 sudo reboot now 重启之后需要挂载磁盘: 2080机器上有两块 mount /dev/sdb1 /mnt/sdb1/ mount /dev/sda1 /mnt/sd 阅读全文
posted @ 2021-11-14 19:57 Rogn 阅读(97) 评论(0) 推荐(0) 编辑
摘要: 因为argmax函数不能求导,也就不会有梯度 backward的反向传播的梯度到loss是终止了 其实也很容易看出这个问题,如果最后一步使用了argmax,loss的属性 requires_grad=False,直接调用backward会提示你需要给loss增加梯度属性,但这“治表不治本 ” 网上有 阅读全文
posted @ 2021-11-14 19:34 Rogn 阅读(2217) 评论(0) 推荐(1) 编辑
摘要: 就是这个进程,运行16h了,其实现在已经停了,但是kill pid 是kill不掉的 因为它成了僵尸进程,被init收养了,我又不能去kill init进程 参考链接https://blog.csdn.net/lechengyuyuan/article/details/16337233 当使用此命令 阅读全文
posted @ 2021-11-14 19:14 Rogn 阅读(77) 评论(0) 推荐(0) 编辑