强化学习配置GPU相关过程汇总

0.引言

以下展示了在为我们Ubuntu配置Cuda等一系列配件,以在跑程序时用上GPU,而需要进行的操作。

1.确定当前驱动与CUDA版本

通过输入:nvidia-smi,可得到下图信息。易知我的驱动版本为:470.141.03,CUDA版本为11.4.

(补充)针对驱动与CUDA的匹配信息可见:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
主体部分见下图,当然网页下方有更详细精确的版本配对信息。

2.安装与CUDA版本配对的配件

在为新创建的虚拟环境安装torch等配件时,遇到了一个bug:分明安装了指定版本的torch,但CUDA识别不了。
即:

其实很自然,输出表明安装的torch不是gpu版本,而是cpu版本。于是引出我们后续需要采用的动作:安装适用于gpu版本的配件。
在这个网址:https://pytorch.org/get-started/locally/其实可以找到靠谱的安装命令,但奈何对应最新的CUDA版本,不太适合我的老旧CUDA。
实际上最后在下面网址找到了解决方案:
https://pytorch.org/get-started/previous-versions/
首先选择需要的pytorch版本,由于我的虚拟环境需要torch>=1.11,于是挑了后面一些的。
注意别选:

(我感觉这还是cpu版本的?)
最后选了:

命令为:
pip install torch==1.11.0+cu113 torchvision==0.12.0+cu113 torchaudio==0.11.0+cu113 --extra-index-url https://download.pytorch.org/whl/cu113

3.测试GPU是否能使用

最后在你的虚拟环境下进入python,并运行:
import torch
torch.cuda.is_available()
若输出True,即成功啦!

posted @ 2022-10-29 16:49  Lumarkov  阅读(409)  评论(0)    收藏  举报