CUDA 10.1 系统安装 Ubuntu18.04

1. Nvidia 驱动安装

  1. 安装Ubuntu 18.04 系统

  2. 更新系统软件到最新

  sudo apt update

  sudo apt upgrade

  sudo apt dist-upgrade

  P.S. 一定要更新到官方给定的对应工具和kernel版本。

  详细可以查看官方网站,以下是CUDA 10.1的网站

  https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html

  3. 到官网下载对应的驱动安装包

  https://www.nvidia.cn/Download/index.aspx

  4. 如果显卡较新,18.04的内核同步还不到位,我们需要手动更新一下支持的PCI ID。

  sudo update-pciids

  用以下命令看下你们的显卡是否已经进去了

  sudo cat /usr/share/misc/pci.ids | grep -i rtx

  然后查看当前插入的显卡是否正确识别

  lspci | grep -i nvidia

  5. 安装依赖工具

  sudo apt-get install gcc g++ make

  P.S. g++不是必须的,但是保险点,安装下比较好

  6. 禁止nouveau

  sudo vim /etc/modprobe.d/blacklist.conf

  在文件末尾加入

  blacklist nouveau

  options nouveau modeset=0

  执行如下命令生效

  sudo update-initramfs -u

  重启系统,然后用以下命令查看是否成功禁止

  lsmod | grep nouveau

  当输出为空,则禁止成功。

  11. 卸载之前的nvidia驱动

  用如下命令查看是否有nvidia驱动

  dpkg -l | grep -i nvidia

  如果为空,则跳过此步骤,否则,请安装如下命令卸载

  重启系统,然后不停按esc,进入grub模式,也就是一个选择ubuntu还是advanced选项模式,按’e’按键

  然后修改 “quiet splash” 这一行,在这行最后加个空格3

  然后按F10,进入系统模式

  之后输入如下命令清除

  sudo apt-get purge nvidia-*

  sudo apt-get purge libnvidia-*

  sudo apt-get autoremove nvidia-*

  sudo apt-get autoremove libnvidia-*

  12. 开始安装驱动

  首先输入以下命令关闭界面模式

  sudo telinit 3

  然后执行安装

  sudo chmod +x 驱动包名

  sudo CC=gcc-7 ./驱动包名 -no-opengl-files -no-x-check

  此步骤选择继续安装,即使预安装脚本执行失败也继续安装

  The distribution-provided pre-install script failed! Continue? - [Yes]

  当你出现如下话的时候,请退出安装

  The target kernel has CONFIG_MODULE_SIG set, which means that it supports cryptographic signatures on kernel modules. On some systems, the kernel may refuse to load modules without a valid signature from a trusted key. This system also has UEFI Secure Boot enabled; many distributions enforce module signature verification on UEFFI systems when SecureBoot is enable. Would you like to sign NVIDIA kernel module?

  这步意味着你secure boot打开了,首先进入boost模式,进入引导安全,然后关闭引导安全,打开旧模式,在引导模式中确定旧模式已经打开,重启电脑,如上再安装

  Install NVIDIA's 32-bit compatibility libraries? - [NO]

  这步出现问题,具体忘了什么问题了。可以直接百度,装几个包就行了。

  Would you like to run the nvidia-xconfig utility to automatically update your X configuration file so that the NVIDIA driver will be used when you restart X? - [No]

  Your X configuration file has been successfully updated. Installation of the NVIDIA Accelerated Graphics Driver for Linux-x86_64 (version: 367.35) is now complete. -[OK]

  这样就安装完成了,我遇到的问题不一定很全,dkms问题我并没有遇到,有个大佬写了个文章,虽然比较泛化,但是装过之后看就觉得写得很详细了。

  https://blog.csdn.net/zhangrelay/article/details/54670913

 2. CUDA 安装

  1. 首先在这个网址下载安装包,

  http://developer.nvidia.com/cuda-downloads

  根据自己的情况选择下

  P.S. 因为之前的NVidia显卡是我们手动安装的,所以一定注意要下载runfile

  2. 请到这个网站

  https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html

  先根据第1,第2章节确认当前系统是否有遗漏什么。

  然后到第4章节开始安装。第一步输入accept就行了。

  P.S. 因为我们已经安装了驱动,所以在安装的时候要去掉Driver,如图1,然后install就行了

  PPS. 一定要确保集成显卡已经禁掉了,不然会安装失败的。

  安装成功之后会如图2所示

  3. 添加环境变量

  请修改.bashrc文件末尾添加如下命令。

  export PATH="/usr/local/cuda-10.1/bin:$PATH"

  export LD_LIBRARY_PATH="/usr/lcoal/cuda-10.1/lib64:$LD_LIBRARY_PATH"

  然后使其生效就行了。

  4. 请按照如下命令测试是否安装成功

  cd /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery

  sudo make

  ./deviceQuery

  成功会如图3所示

       图1

 

           图2

 

         图3

3. CUDNN安装

  1. 在该网站下载安装包

  https://developer.nvidia.com/rdp/cudnn-archive

  P.S. 下载的时候注意runtime,developer和codes samples and User Guide都要下载

  2. 用如下命令安装

  sudo dpkg -i 包名

  P.S. 安装的时候先安装runtime的,然后安装developer的,最后安装docs的。

  3. 用如下命令查看CUDNN版本。

  cat /usr/include/cudnn.h | grep CUDNN_MAJOR -A 2

  从上到下的输出应该是版本号。

  4. 按照如下命令验证是否安装成功

  cp -r /usr/src/cudnn_samples_v7/ $HOME

  cd $HOME/cudnn_samples_v7/mnistCUDNN

  make clean && make

  ./mnistCUDNN

  最后运行结果应该是Test Passed!

posted @ 2021-06-16 19:22  FatTank  阅读(707)  评论(0)    收藏  举报