利用GPU训练网络时遇到的一些问题

1. OSError: [Error 12] Cannot allocate memory

解决办法: 出现这个错误时我是绝望的。。。因为我看了别人的解决办法,要加内存条才能解决。。。但是我不甘心,想了很久——发现了一个解决办法:将 DataLoader 中的 num_workers设置为1。缺点:数据加载必然变得很慢,可怜我的内存条只有 8 个G

2. RuntimeError: CUDA error: device-side assert triggered

解决办法: 检查类别数目设置是否有误!标签分类应该从 0 开始,如果共有10类,则类别应是从 0 开始直到 19

3. CUDA error: out of memory

解决办法: 可以适当缩小 batch size 来解决

posted @ 2019-09-09 22:31  虔诚的树  阅读(822)  评论(0编辑  收藏  举报