Ubuntu 安装显卡驱动、cuda、cudnn总结
这一次安装的电脑环境:
Ubuntu 64位,版本:16.04.1
安装步骤:
首先安装NVIDIA显卡驱动:
本次用apt-get安装nvidia-390,安装之前我们首先要使用apt-cache search <package-name> 查询一下是否有这个安装包。
如果有:就用apt-get install nvidia-390。否则需要去官网查然后在下下来:http://www.geforce.cn/drivers https://developer.nvidia.com/cuda-downloads
安装完之后,使用lshw -c video 查看是否有driver=nvidia字样,要是没有,可以重启看看
然后安装Cuda9.1:
官网搜索下载:https://developer.nvidia.com/cuda-toolkit-archive。
安装:
`sudo dpkg -i cuda-repo-ubuntu1604-9-1-local_9.1.85-1_amd64.deb`
`sudo apt-key add /var/cuda-repo-<version>/7fa2af80.pub`
`sudo apt-get update`
`sudo apt-get install cuda`
装好之后,配置/etc/profile文件:
export CUDA_HOME=/usr/local/cuda
export PATH=${CUDA_HOME}/bin:${PATH}
export LD_LIBRARY_PATH=${PATH}/lib64:${LD_LIBRARY_PATH}
之后source /etc/profile,然后使用nvcc -V 如果有信息就表示安装好了。
最后安装cudnn-7.0加速:
官网搜索下载:https://developer.nvidia.com/rdp/cudnn-archive
下载cuDNN v-<version> Library for Linux这一款
然后解压:tar -xvf cudnn-<version>-linux-x64-v<version>.tgz
cd cuda
sudo cp include/cudnn.h /usr/local/cuda/include/
sudo cp lib64/* /usr/local/cuda/lib64/
cd /usr/local/cuda/lib64
sudo ln -sf libcudnn.so.7.0.5 libcudnn.so.7
sudo ln -sf libcudnn.so.7 libcudnn.so
sudo ldconfig -v
到此完成安装。
查看版本:
cuda 版本
cat /usr/local/cuda/version.txt
cudnn 版本
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
注意事项:
当出现" Driver/library version mismatch "问题的时候主要是kernel mod 的 Nvidia driver 的版本没有更新,一般情况下,重启机器就能够解决,如果因为某些原因不能够重启的话,也有办法reload kernel mod。
参考链接:https://comzyh.com/blog/archives/967/
卸载:
首先你需要查看你是哪一步出了问题:
首先先查是否是驱动:
lshw -c video
看configurure字段有木有driver字样,若有内容,则显卡驱动装好了
查看nvidia的安装版本:
sudo dpkg --list | grep nvidia-*
如果有多个版本可以删除只留下一个版本:
sudo apt remove --purge nvidia-384
如何nvidia-smi是好用的,说明你的显卡驱动正常。
在查看是否是Cuda没有装好:
在/etc/profile中添加如下路劲:
export CUDA_HOME=/usr/local/cuda-8.0
export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}
然后重启profile文件,source /etc/profile.
使用nvcc -V 会得到相应的nvcc编译器相应的信息,那么CUDA配置成功了
卸载cuda的方法:
sudo apt-get remove cuda
sudo apt-get autoclean
sudo apt-get remove cuda*
然后删除apt-get 列表中的配置信息:
0. sudo dpkg --list|grep cuda*
1.sudo apt-get remove [--purge] cuda-repo-ubuntu1604-9-0-local* ;
其中--purge可选项,清除配置文件。
2.sudo apt-get autoremove ;
如果卸载不掉,可以使用一下方法循环删除:
dpkg -l |grep cuda |awk '{print $2}' |xargs sudo dpkg -P

浙公网安备 33010602011771号