docker 容器使用宿主机显卡驱动

1. 确保宿主机已安装NVIDIA驱动

首先，确保宿主机已正确安装NVIDIA驱动，并且驱动版本与CUDA版本兼容。可以通过以下命令查看驱动信息：

nvidia-smi

2. 安装Docker

如果尚未安装Docker，可以参考以下命令进行安装：

# 更新系统软件
sudo yum update -y
# 安装必要依赖项
sudo yum install -y yum-utils device-mapper-persistent-data lvm2
# 添加Docker的yum源
sudo yum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo
# 安装Docker
sudo yum install docker-ce docker-ce-cli containerd.io
# 启动Docker服务
sudo systemctl start docker

3. 安装NVIDIA Container Toolkit

NVIDIA Container Toolkit是使Docker容器能够访问NVIDIA GPU的关键组件。安装步骤如下：

# 添加NVIDIA Container Toolkit的GPG密钥和存储库
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo | \
  sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
# 安装NVIDIA Container Toolkit
sudo yum install -y nvidia-container-toolkit
# 重启Docker服务
sudo systemctl restart docker

4. 验证安装

运行以下命令验证Docker容器是否能够使用GPU：

docker run --gpus all nvidia/cuda:11.0-base nvidia-smi

如果安装成功，上述命令将输出NVIDIA GPU的信息。

5. 创建Docker容器并使用GPU

创建Docker容器时，使用--gpus选项来指定GPU资源。例如：

docker run --gpus all -it nvidia/cuda:11.0-base bash

在容器内运行nvidia-smi命令，检查GPU状态，确保GPU可用。

6. 配置Docker守护进程（可选）

如果需要将NVIDIA运行时设置为默认运行时，可以编辑Docker的配置文件/etc/docker/daemon.json：

JSON

复制

{
  "runtimes": {
    "nvidia": {
      "path": "/usr/bin/nvidia-container-runtime",
      "runtimeArgs": []
    }
  },
  "default-runtime": "nvidia"
}

然后重启Docker服务：

bash

复制

sudo systemctl restart docker

通过以上步骤，即可使启动的Docker容器使用宿主机的显卡驱动。

posted on 2025-05-31 10:36 属于我的梦，明明还在阅读(964) 评论(0) 收藏举报