1. 确保宿主机已安装NVIDIA驱动

首先,确保宿主机已正确安装NVIDIA驱动,并且驱动版本与CUDA版本兼容。可以通过以下命令查看驱动信息:
nvidia-smi

2. 安装Docker

如果尚未安装Docker,可以参考以下命令进行安装
# 更新系统软件
sudo yum update -y
# 安装必要依赖项
sudo yum install -y yum-utils device-mapper-persistent-data lvm2
# 添加Docker的yum源
sudo yum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo
# 安装Docker
sudo yum install docker-ce docker-ce-cli containerd.io
# 启动Docker服务
sudo systemctl start docker

3. 安装NVIDIA Container Toolkit

NVIDIA Container Toolkit是使Docker容器能够访问NVIDIA GPU的关键组件。安装步骤如下:
# 添加NVIDIA Container Toolkit的GPG密钥和存储库
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo | \
  sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
# 安装NVIDIA Container Toolkit
sudo yum install -y nvidia-container-toolkit
# 重启Docker服务
sudo systemctl restart docker

4. 验证安装

运行以下命令验证Docker容器是否能够使用GPU
docker run --gpus all nvidia/cuda:11.0-base nvidia-smi
 
如果安装成功,上述命令将输出NVIDIA GPU的信息。

5. 创建Docker容器并使用GPU

创建Docker容器时,使用--gpus选项来指定GPU资源。例如:
docker run --gpus all -it nvidia/cuda:11.0-base bash
 
在容器内运行nvidia-smi命令,检查GPU状态,确保GPU可用。

6. 配置Docker守护进程(可选)

如果需要将NVIDIA运行时设置为默认运行时,可以编辑Docker的配置文件/etc/docker/daemon.json
JSON
复制
{
  "runtimes": {
    "nvidia": {
      "path": "/usr/bin/nvidia-container-runtime",
      "runtimeArgs": []
    }
  },
  "default-runtime": "nvidia"
}
 
然后重启Docker服务:
bash
复制
sudo systemctl restart docker
 
通过以上步骤,即可使启动的Docker容器使用宿主机的显卡驱动。
posted on 2025-05-31 10:36  属于我的梦,明明还在  阅读(425)  评论(0)    收藏  举报