1. 确保宿主机已安装NVIDIA驱动
首先,确保宿主机已正确安装NVIDIA驱动,并且驱动版本与CUDA版本兼容。可以通过以下命令查看驱动信息:
nvidia-smi
2. 安装Docker
如果尚未安装Docker,可以参考以下命令进行安装:
# 更新系统软件
sudo yum update -y
# 安装必要依赖项
sudo yum install -y yum-utils device-mapper-persistent-data lvm2
# 添加Docker的yum源
sudo yum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo
# 安装Docker
sudo yum install docker-ce docker-ce-cli containerd.io
# 启动Docker服务
sudo systemctl start docker
3. 安装NVIDIA Container Toolkit
NVIDIA Container Toolkit是使Docker容器能够访问NVIDIA GPU的关键组件。安装步骤如下:
# 添加NVIDIA Container Toolkit的GPG密钥和存储库
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo | \
sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
# 安装NVIDIA Container Toolkit
sudo yum install -y nvidia-container-toolkit
# 重启Docker服务
sudo systemctl restart docker
4. 验证安装
运行以下命令验证Docker容器是否能够使用GPU:
docker run --gpus all nvidia/cuda:11.0-base nvidia-smi
如果安装成功,上述命令将输出NVIDIA GPU的信息。
5. 创建Docker容器并使用GPU
创建Docker容器时,使用
--gpus选项来指定GPU资源。例如:docker run --gpus all -it nvidia/cuda:11.0-base bash
在容器内运行
nvidia-smi命令,检查GPU状态,确保GPU可用。6. 配置Docker守护进程(可选)
如果需要将NVIDIA运行时设置为默认运行时,可以编辑Docker的配置文件
/etc/docker/daemon.json:JSON
{
"runtimes": {
"nvidia": {
"path": "/usr/bin/nvidia-container-runtime",
"runtimeArgs": []
}
},
"default-runtime": "nvidia"
}
然后重启Docker服务:
bash
sudo systemctl restart docker
通过以上步骤,即可使启动的Docker容器使用宿主机的显卡驱动。
浙公网安备 33010602011771号