显卡问题集合

  • 问题2:服务器上多块显卡,固定使用其中的一块
    • 问题2.1:代码中多显卡设备只能识别到一块显卡(显示显卡的数目为1,不是真实的显卡数目)

      • 修改代码如下
      #修改~/.bashrc里面的代码,将里面的 export UDA_VISIBLE_DEVICES=0,1,2,3设置为你的显卡数目
      vim ~/.bashrc     #打开文件
      source ~/.bashrc      #刷新文件
      #最好是关闭一下终端,然后就生效了
      
      • 验证

        • python
        import torch
        import os
        os.environ["CUDA_VISIBLE_DEVICES"]="0,1,2,3,4,5,6,7"
        print(torch.cuda.device_count()) #打印出当前使用显卡的数目
        
    • 问题2.2:代码os.environ["CUDA_VISIBLE_DEVICES"]="0,1,2"无效(这里的显卡数目是真实所有的显卡,不是我们设计的显卡号)

      • os.environ["CUDA_VISIBLE_DEVICES"]="0,1,2,3,4,5,6,7"这行代码放到所有代码的前面,import引入包的代码之前(除了import os)
      • 验证print(torch.cuda.device_count())
    • <font color=red>使用的显卡默认为显卡号0</font>

      • os.environ["CUDA_VISIBLE_DEVICES"]="1,2,3,4,5,6,7"里面不要写上0,然后第一个数字就是我们使用的主卡,后面修改显卡,想用几号就只留几号。
posted @ 2022-03-28 21:32  glq1996  阅读(132)  评论(0)    收藏  举报