硬件配置篇1--ubuntu下gpu 配置 tenserflow(未完待续)
0.基本配置 + 先验知识 + 注意事项
0.1 基本配置
系统:ubuntu16.04
GPU:实验室公共GPU服务器 GP102 [TITAN Xp]
0.2 先验知识
0.3 注意事项
注:安装每一项之前要做两件事--
1)确定需要安装的版本,注意版本对应
2)查看是否已经安装
1.查看是否已经安装显卡驱动、CUDA、cuDNN、gcc编译器版本,tf各版本对应
1.1 查看是否已经安装显卡驱动 --- GPU
这一步对我来说直接跳过了,实验室的师兄已经给我安装好了,这里我就直接查看了。
1.1.1 查看显卡型号
lspci | grep -i vga
或者类似命令


The PCI ID Repository 可以按照十六进制数字代码找到相应的显卡型号。
1.1.2 已知是NVIDIA显卡
nvidia命令查看显卡型号+GPU版本信息+GPU使用信息
nvidia-smi

第一栏的Fan:N/A是风扇转速,从0到100%之间变动,这个速度是计算机期望的风扇转速,实际情况下如果风扇堵转,可能打不到显示的转速。有的设备不会返回转速,因为它不依赖风扇冷却而是通过其他外设保持低温(比如我们实验室的服务器是常年放在空调房间里的)。
第二栏的Temp:是温度,单位摄氏度。
第三栏的Perf:是性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能。
第四栏下方的Pwr:是能耗,上方的Persistence-M:是持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态。
第五栏的Bus-Id是涉及GPU总线的东西,domain🚌device.function
第六栏的Disp.A是Display Active,表示GPU的显示是否初始化。
第五第六栏下方的Memory Usage是显存使用率。
第七栏是浮动的GPU利用率。
第八栏上方是关于ECC的东西。
第八栏下方Compute M是计算模式。
1.1.3 其他相关链接和命令
类似win下的任务资源管理器:https://www.cnblogs.com/peida/archive/2012/12/24/2831353.html
top
1.2 查看当前CUDA cuDNN 版本
(可能服务器已经安装了)
cuda 版本
cat /usr/local/cuda/version.txt
cudnn 版本
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
nvcc --version
或者
nvcc -V
1.3 查看编译器gcc g++版本
gcc --version
g++ --version
1.3 查看tf对应CUDA、cuDNN、编译器版本
tf官网:https://tensorflow.google.cn/install/source
2.下载
2.1 CUDA
NIVIDA官网:
2.2 下载cuDNN
NIVIDA官网(对应CUDA版本):
https://developer.nvidia.com/rdp/cudnn-archive#a-collapse742-10
(官网下载需注册登录)
CUDA和cuDNN 版本对应关系及下载链接:
https://developer.nvidia.com/rdp/cudnn-archive#a-collapse742-10 (官网)
3.安装
3.1 下载和安装显卡驱动 --- GPU
环境搭建01——Ubuntu如何查看显卡信息及安装NVDIA显卡驱动
3.2 编译器
如果因为cuda支持的版本很低要对gcc,g++降级,如下载安装4.8版本
sudo apt-getinstall gcc-4.8
sudo apt-getinstall g++-4.8
------
cd /usr/bin
sudo rm gcc
sudo ln -s gcc-4.8 gcc
sudo rm g++
sudo ln -s g++-4.8 g++
3.3 CUDA
3.4 cuDNN
官网:
https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html#prerequisites

进入CUDNN安装包所在目录,执行以下命令:
sudodpkg -i runtime包.deb
sudodpkg -i developer包.deb
sudodpkg -i 代码sample包.deb
CUDNN安装完成。
3.5 参考链接
高分答案(我觉得不大行):
Ubuntu16.04下安装cuda和cudnn的三种方法(亲测全部有效)
tf安装
官网:https://tensorflow.google.cn/install/source
完整程序参考:
Linux下CUDA+CUDNN+TensorFlow安装笔记
(pytorch类似,不过官网上好像没啥支持版本的说法)
Ubuntu配置GPU版本pytorch环境(含NVIDIA驱动+Cuda+Cudnn)
重启:
reboot
shurdown -r

浙公网安备 33010602011771号