硬件配置篇1--ubuntu下gpu 配置 tenserflow(未完待续)

0.基本配置 + 先验知识 + 注意事项

0.1 基本配置

系统:ubuntu16.04

GPU:实验室公共GPU服务器  GP102 [TITAN Xp]

0.2 先验知识

GPU, CUDA,cuDNN三者的关系总结

0.3 注意事项

注:安装每一项之前要做两件事--

1)确定需要安装的版本,注意版本对应

2)查看是否已经安装

 

1.查看是否已经安装显卡驱动、CUDA、cuDNN、gcc编译器版本,tf各版本对应

1.1 查看是否已经安装显卡驱动 --- GPU

这一步对我来说直接跳过了,实验室的师兄已经给我安装好了,这里我就直接查看了。

1.1.1  查看显卡型号 

lspci | grep -i vga

或者类似命令

The PCI ID Repository 可以按照十六进制数字代码找到相应的显卡型号。

1.1.2  已知是NVIDIA显卡

nvidia命令查看显卡型号+GPU版本信息+GPU使用信息

nvidia-smi   


 

第一栏的Fan:N/A是风扇转速,从0到100%之间变动,这个速度是计算机期望的风扇转速,实际情况下如果风扇堵转,可能打不到显示的转速。有的设备不会返回转速,因为它不依赖风扇冷却而是通过其他外设保持低温(比如我们实验室的服务器是常年放在空调房间里的)。

第二栏的Temp:是温度,单位摄氏度。

第三栏的Perf:是性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能。

第四栏下方的Pwr:是能耗,上方的Persistence-M:是持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态。

第五栏的Bus-Id是涉及GPU总线的东西,domain🚌device.function

第六栏的Disp.A是Display Active,表示GPU的显示是否初始化。

第五第六栏下方的Memory Usage是显存使用率。

第七栏是浮动的GPU利用率。

第八栏上方是关于ECC的东西。

第八栏下方Compute M是计算模式。

1.1.3 其他相关链接和命令

Linux(Ubuntu)系统查看显卡型号

百度知道还提供了一些非命令行的方法

怎样在ubuntu中查看自己的显卡型号及其对应驱动的安装

类似win下的任务资源管理器:https://www.cnblogs.com/peida/archive/2012/12/24/2831353.html

top

1.2 查看当前CUDA cuDNN 版本

(可能服务器已经安装了)

cuda 版本 

cat /usr/local/cuda/version.txt

cudnn 版本 

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

nvcc --version

或者

nvcc -V 

1.3 查看编译器gcc g++版本

gcc --version

g++ --version

1.3 查看tf对应CUDA、cuDNN、编译器版本

tf官网:https://tensorflow.google.cn/install/source

2.下载

2.1 CUDA

NIVIDA官网:

2.2 下载cuDNN

NIVIDA官网(对应CUDA版本):

https://developer.nvidia.com/rdp/cudnn-archive#a-collapse742-10

(官网下载需注册登录)

CUDA和cuDNN 版本对应关系及下载链接:

https://developer.nvidia.com/rdp/cudnn-archive#a-collapse742-10 (官网)

3.安装

3.1 下载和安装显卡驱动 --- GPU

环境搭建01——Ubuntu如何查看显卡信息及安装NVDIA显卡驱动

linux安装NVIDIA驱动

怎样在ubuntu中查看自己的显卡型号及其对应驱动的安装

3.2 编译器

如果因为cuda支持的版本很低要对gcc,g++降级,如下载安装4.8版本

sudo apt-getinstall gcc-4.8

sudo apt-getinstall g++-4.8

------

cd /usr/bin

sudo rm gcc

sudo ln -s gcc-4.8 gcc

sudo rm g++

sudo ln -s g++-4.8 g++ 

3.3 CUDA

 

3.4 cuDNN

官网:

https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html#prerequisites


 

进入CUDNN安装包所在目录,执行以下命令:

sudodpkg -i runtime包.deb

sudodpkg -i developer包.deb

sudodpkg -i 代码sample包.deb

CUDNN安装完成。

3.5 参考链接

高分答案(我觉得不大行):

Ubuntu16.04下安装cuda和cudnn的三种方法(亲测全部有效)

tf安装

官网:https://tensorflow.google.cn/install/source

完整程序参考:

Linux下CUDA+CUDNN+TensorFlow安装笔记

(pytorch类似,不过官网上好像没啥支持版本的说法)

Ubuntu配置GPU版本pytorch环境(含NVIDIA驱动+Cuda+Cudnn)

安装cuda+cudnn+pytorch环境

重启:

reboot

shurdown -r

posted @ 2020-07-30 18:12  aha是Q啊  阅读(291)  评论(0)    收藏  举报