计划在AnolisOS8.6上部署DeepSeek推理模型。比较重要的一步是安装显卡驱动,此篇重点记录安装NVIDIA驱动和CUDA
硬件组装和安装操作系统
找到两张NVIDIA GeForce RTX 2080 Ti 显卡,服务器硬盘做RAID后安装AnolisOS8.6操作系统。配置外网。
查看系统版本,显示Anolis OS release 8.6
cat /etc/system-release
查询显卡型号
lspci |grep -i vga
禁用nouveau并重启(安装Nvidia显卡的官方驱动和系统自带的nouveau驱动冲突)
lsmod |grep nouveau
创建文件/etc/modprobe.d/blacklist-nouveau.conf 加如下两行
blacklist nouveau
options nouveau modset=0
更新,并重启
dracut --force
reboot
查看是否禁用成功。若没有输出,则表示禁用成功。
lsmod |grep nouveau
安装基础依赖环境
yum -y install gcc kernel-devel kernel-headers
下载驱动
官网下载地址:https://www.nvidia.cn/Download/index.aspx?lang=cn
下载成功后上传至/opt目录下执行安装
chmod +X NVIDIA-Linux-x86_64-550.144.03.run
sh NVIDIA-Linux-x86_64-550.144.03.run
一路回车到成功。
检查是否安装成功
nvidia-smi
安装 CUDA
下载适用于 Linuxx86_64 的安装程序
wget https://developer.download.nvidia.com/compute/cuda/12.4.1/local_installers/cuda_12.4.1_550.54.15_linux.run
sudo sh cuda_12.4.1_550.54.15_linux.run
安装时,不要再选nvidia驱动,因为前面我们已经安装过了
显示成功信息。
记录这三行
Please make sure that
- PATH includes /usr/local/cuda-12.4/bin
- LD_LIBRARY_PATH includes /usr/local/cuda-12.4/lib64, or, add /usr/local/cuda-12.4/lib64 to /etc/ld.so.conf and run ldconfig as root
配置环境变量
vim ~/.bashrc
增加两行
export PATH="/usr/local/cuda-12.4/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-12.4/lib64:$LD_LIBRARY_PATH"
然后再 source ~/.bashrc 一下,更新一下变量。
然后 键入 nvcc -V 看一下是否安装成功
显示相关信息,安装成功。