• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
nannandbk
博客园    首页    新随笔    联系   管理    订阅  订阅
NVIDIA驱动失效简单解决方案:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.

NVIDIA驱动失效简单解决方案:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.

问题:准备用GPU跑模型时,提示cuda 不存在

  • 第一步,打开终端,输入:vidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. 
Make sure that the latest NVIDIA driver is installed and running.
  • 第二步,使用nvcc -V检查驱动和cuda。
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2018 NVIDIA Corporation
Built on Sat_Aug_25_21:08:01_CDT_2018
Cuda compilation tools, release 10.0, V10.0.130

发现驱动是存在的,于是进行下一步。

  • 第三步,查看已安装驱动的版本信息
ls /usr/src | grep nvidia

比如我的驱动版本是:nvidia-535.161.08

  • 第四步,依次输入以下命令
sudo apt-get install dkms
sudo dkms install -m nvidia -v 535.161.08

发现:

Error! Could not locate dkms.conf file.
File: /usr/src/nvidia-535.161.08/dkms.conf does not exist.

这个问题可能是因为 NVIDIA 驱动的安装包不完整,或者是安装过程中某些步骤出了问题。

接下来,用命令行在 Ubuntu 22.04/20.04 上安装 Nvidia 驱动程序。

前置准备

  • 首先,确保您的系统更新到最新状态。在 Ubuntu 中,可以使用以下命令进行更新:
sudo apt update && sudo apt upgrade
  • 安装编译所需的包和工具(如果您还没有安装的话):
sudo apt install build-essential dkms
  • 移除旧的 NVIDIA 驱动(如果已经安装):
sudo apt-get remove --purge '^nvidia-.*'

接下来开始安装

首先,打开终端窗口并使用以下命令检查 Nvidia 卡使用的驱动程序。

sudo lshw -c display

image

接下来,运行以下命令从默认 Ubuntu 存储库列出 Nvidia 卡的可用驱动程序。

sudo ubuntu-drivers devices

要安装推荐(recommended)的驱动程序,请运行以下命令。

sudo ubuntu-drivers autoinstall

您可以使用以下命令检查现在正在使用哪张卡:

prime-select query

如果您想使用Intel显卡,请运行以下命令:

sudo prime-select intel

要切换回 Nvidia 卡,请运行

sudo prime-select nvidia

请注意,可能需要重新启动才能使更改生效!

然后我们就可以用 nvidia-smi查看
image

posted on 2024-04-18 22:02  nannandbk  阅读(20090)  评论(0)    收藏  举报
刷新页面返回顶部
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3