处理centos7 中docker使用gpu报错 could not select device driver "" with capabilities: [[gpu]]
在一台centos7 docker使用gpu时报错:could not select device driver "" with capabilities: [[gpu]].
需要安装 nvidia-container-runtime。
在安装时由于各种库报错,其实最终原因是网络问题,访问不到库。处理逻辑是在一台可以自由访问网络的centos7上安装,然后将所有依赖的安装软件包,复制到需要安装的服务器上。因为两台都是X86结构服务器所以没问题。此方法可以用来解决其他类似没法安装的情况。所以记录一下。
设置源:
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-container-runtime/$distribution/nvidia-container-runtime.repo | \
sudo tee /etc/yum.repos.d/nvidia-container-runtime.repo
执行后查看一下文件,需要有内容。
cat /etc/yum.repos.d/nvidia-container-runtime.repo
安装:
yum install nvidia-container-runtime
测试是否安装成功,实际需要在容器中执行nvidia-smi 命令,但是一般容器可以开启就是没问题的:
docker run --gpus all ollama
查看包需要的依赖
yum deplist nvidia-container-runtime
用repotrack 将依赖包保存到文件夹
yum -y install yum-utils
mkdir /nvidia-packages
cd /nvidia-packages
repotrack nvidia-container-runtime
将 /nvidia-packages 文件夹复制到目标服务器。然后cd 到目录下执行。
yum localinstall -y ./*
在目标服务器执行,没有报错了
docker run --gpus all ollama

浙公网安备 33010602011771号