处理centos7 中docker使用gpu报错 could not select device driver "" with capabilities: [[gpu]]

在一台centos7 docker使用gpu时报错:could not select device driver "" with capabilities: [[gpu]].

需要安装 nvidia-container-runtime。

在安装时由于各种库报错,其实最终原因是网络问题,访问不到库。处理逻辑是在一台可以自由访问网络的centos7上安装,然后将所有依赖的安装软件包,复制到需要安装的服务器上。因为两台都是X86结构服务器所以没问题。此方法可以用来解决其他类似没法安装的情况。所以记录一下。

设置源:

distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-container-runtime/$distribution/nvidia-container-runtime.repo | \
sudo tee /etc/yum.repos.d/nvidia-container-runtime.repo

执行后查看一下文件,需要有内容。

cat /etc/yum.repos.d/nvidia-container-runtime.repo

安装:

yum install nvidia-container-runtime

测试是否安装成功,实际需要在容器中执行nvidia-smi 命令,但是一般容器可以开启就是没问题的:

docker run  --gpus all ollama

查看包需要的依赖

yum deplist nvidia-container-runtime

用repotrack 将依赖包保存到文件夹

yum -y install yum-utils
mkdir /nvidia-packages
cd /nvidia-packages
repotrack nvidia-container-runtime

将 /nvidia-packages 文件夹复制到目标服务器。然后cd 到目录下执行。

yum localinstall -y ./*

在目标服务器执行,没有报错了

docker run  --gpus all ollama
posted @ 2025-02-21 19:11  熊先生不开玩笑  阅读(482)  评论(0)    收藏  举报