Linux-非Root用户-配置深度学习环境
1 简介
- Anaconda:是一个开源的Python发行版本,其包含了conda、Python等软件包,numpy,pandas,scipy等科学计算包.
- Conda:包管理器, venv+pip的作用,也就是虚拟环境+包管理。
- Nvidia: 显卡制造商。
- 显卡:承担输出显示图形的任务。
- GPU:图形处理器,是显卡内部的处理器,
- cuda:Nvidia推出的运算平台,用于并行计算的框架,使GPU能够解决负责的计算问题。
- cudnn: 针对深度卷积神经网络的加速库
- 显卡驱动: 可以调用GPU并行计算能力的驱动程序
2 前言
- 图片中的实例路径为文件夹以sl示例,实际操作中更改为本人用户。
- 数据和软件存放建议存放于 /data/用户 ,小文件可以存放于 /home/用户,通过df -h命令可以查看磁盘使用情况,data下共有3.6T可用。

- 实际操作通过第四台服务器为例
- 建议使用MobaXterm连接服务器:具体信息请参考
3 Anaconda 安装
- Anaconda下载
-
上传安装包到服务器
通过MobaXterm工具可以快速将刚才下载的安装包上传到服务器中

-
Anaconda安装: 新建一个soft文件夹用于存放下载的软件文件
- 可视化界面中右键可以创建新文件夹(也可以使用mkdir命令),我的软件安装文件都存在/home/sl/soft中,数据和软件都存在/data/sl/中



- MobaXterm重新连接服务器,这时候命令输入前多了一个base,说明conda已经在环境变量中,可以使用conda命令。

- 查看已安装的包

- 其中看到Python版本

4 配置虚拟环境
1.创建虚拟环境




2. 虚拟环境中安装第三方包
- 方法一:conda install package_name
- 方法二:pip安装,例如安装opencv

5 安装PyTorch
- 官网选择对应命令

- 在虚拟环境中安装


- 注意: 使用conda命令安装PyTorch会自动安装对应cuda版本
cuda版本与显卡驱动版本对应
如果不需要使用ncvv命令,安装PyTorch或者tenserflow后也可以使用GPU加速。
6 配置cuda
方法1 使用Root下Cuda
- 查看cuda是否安装,-> 没有安装

- 查找Root下cuda安装位置

- 配置自己用户下的环境变量,使用MobaXterm工具可以双击打开文件编辑器


- 复制以下内容到文件末端
# cuda
export CUDA_HOME=/usr/local/cuda-10.0
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH
export PATH=/usr/local/cuda-10.0/bin:$PATH
# cuda
- 关闭MobaTextEditor后会询问是否保存到服务器,选择保存。
- 查看结果

至此,已经完成了基本环境的配置,已经可以正常使用GPU计算资源。
方法2 非Root用户安装cuda
- 回到base环境中

- 查看Linux信息,并记住这些信息


- CUDA下载地址


- 下载完成

- 安装过程



- 取消其他安装项目,只安装CUDA Toolkit

- 进入options,修改Toolkit Options




- 修改Library install path

- 完成后安装

- 安装成功显示

- 更改环境变量使用新安装的10.2版本,一下内容添加到.bashrc
# cuda
export CUDA_HOME=/data/sl/cuda-10.2
export LD_LIBRARY_PATH=/data/sl/cuda-10.2/lib/lib64:$LD_LIBRARY_PATH
export PATH=/data/sl/cuda-10.2/bin:$PATH
# cuda

- 使用source ~/.bashrc命令刷新配置文件,或重新登录服务器

7 配置cudnn
- 注册一个Nvidia账户

- 下载对应版本


- 右键复制下载地址,然后在服务器中下载

- 下载完成

-
解压下载包
下载后文件名很长的后缀的话,先修改文件名为xx.tgz

-
cudnn安装
- 按照自己目录复制文件

- 修改对应权限

参考


浙公网安备 33010602011771号