摘要:
gpu 驱动安装失败处理 一、描述 遇到的核心问题是平台部署后 nvidia-smi 命令异常(不存在或无法检测 GPU),导致 GPU 功能不可用,且部署过程中 NVIDIA 驱动安装步骤仅输出失败日志但未终止部署,需要一套完整的排查和解决流程。 二、关键字 gpu, driver, nvidia 阅读全文
posted @ 2023-06-25 09:56
左扬
阅读(191)
评论(0)
推荐(0)
摘要:
如何验证 GPU 模块是否正常? gpu 节点上,运行 nvidia-smi 能正常返回并识别出 GPU 的型号等信息; 通过 ls -la /dev/ | grep nvidia 能看到 nvidia0 等的 GPU 设备。 gpu 节点上,运行 docker info | grep Runtim 阅读全文
posted @ 2023-06-25 09:53
左扬
阅读(293)
评论(0)
推荐(0)

浙公网安备 33010602011771号