升级nvidia驱动程序

升级nvidia驱动程序

  • 先卸载之前的驱动程序

    https://blog.csdn.net/Aaron_qinfeng/article/details/106939938

    按照方法二进行操作

    yum remove nvidia-*  # 清除所有nvidia相关文件和依赖
    #进一步清除
    rpm -qa|grep -i nvid|sort
    yum  remove kmod-nvidia-*
    #重启
    sudo reboot
    
  • 然后按照 https://blog.csdn.net/alex_my/article/details/44705663 进行安装即可

    • 下载驱动:nvidia官网:https://www.nvidia.com/Download/Find.aspx

    • 屏蔽默认带有的nouveau

      • 使用su命令切换到root用户下: su root
      • 打开/lib/modprobe.d/dist-blacklist.conf
      • 将nvidiafb注释掉。
        #blacklist nvidiafb
      • 然后添加以下语句:
        blacklist nouveau
        options nouveau modeset=0
    • 重建initramfs image步骤(这是两行命令)

      mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
      dracut /boot/initramfs-$(uname -r).img $(uname -r)
      
    • 修改运行级别为文本模式

      systemctl set-default multi-user.target
      
    • 重新启动, 使用root用户登陆

      reboot
      
    • 查看nouveau是否已经禁用

      lsmod | grep nouveau
      
    • 进入下载的驱动所在目录

      chmod +x NVIDIA-Linux-x86_64-346.47.run
      ./NVIDIA-Linux-x86_64-346.47.run
      

      安装过程中,选择accept
      如果提示要修改xorg.conf,选择yes

    • 修改运行级别回图形模式

      systemctl set-default graphical.target
      

Nvidia Docker安装后,使用镜像创建容器时出错,错误提示:

Error response from daemon: could not select device driver "" with capabilities: [[gpu]]

需要安装:NVIDIA Container Toolkit

解决:https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html#docker

posted @ 2022-01-09 16:04  EchoZQN  阅读(315)  评论(0编辑  收藏  举报