Radeon GPU上使用ROCm一些技术点


|
操作系统 |
内核 |
支持 |
|
Ubuntu® 22.04.4带HWE的桌面版本 带硬件的Ubuntu®22.04.4桌面版, |
Ubuntu内核6.5 |
是 |
|
PyTorch版本 |
ROCm版本 |
说明 |
|
2.1.2 |
6.1.3 |
官方生产支持。可从AMD.com获取 |
|
2.5+/Nightly |
6.1 |
可从PyTorch.org获取夜间构建版本,未经AMD广泛测试 |
|
2.3/Stable |
6.0 |
Radeon 7000系列不支持 |
4)INT8
12. ONNX + ROCm支持矩阵
ONNX版本、ROCm版本说明信息,见表2-10。
表2-10 ONNX版本、ROCm版本说明信息
|
ONNX版本 |
ROCm版本 |
说明 |
|
1.17 |
6.1.3 |
官方生产支持。可从AMD.com获取。 |
AI数据操作(ONNX)支持多种精度,例如:
1)FP32
2)FP16
3)INT8 (MIGraphX)
4)混合精度 (FP32/FP16)
14. TensorFlow+ROCm支持矩阵
Tensorflow版本、ROCm版本说明信息,见表2-11。
表2-11 Tensorflow版本、ROCm版本说明信息
|
TensorFlow版本 |
ROCm版本 |
说明 |
|
2.15 |
6.1.3 |
官方生产支持。可从AMD.com获取。 |
15. AI数据操作(TensoFlow)精度
AI数据操作(TensorFlow)支持多种精度,例如:
1)FP32
2)FP16
2.8.2 ROCm兼容矩阵(WSL)
1. ROCm 6.1.3
提供有关ROCm™组件、Radeon™GPU和适用于Windows Linux的Radeon软件®子系统(WSL)兼容性的信息。
要回滚以前版本的支持列表和安装说明[3] 。
1. GPU支持矩阵
AMD ROCm支持的操作系统与硬件信息,见表2-12。
表2-12 AMD ROCm支持的操作系统与硬件信息
|
ROCm版本 |
适用于Linux®版本的Radeon™软件 |
适用于Windows版本的Radeon™软件 |
支持的AMD Radeon™硬件 |
|
6.1.3 |
24.10.3 |
AMD软件:适用于WSL 2的Adrenalin Edition™24.6.1 |
AMD Radeon RX 7900 XTX |
2. 框架+ROCm支持矩阵
查看PyTorch的ROCm支持矩阵。
PyTorch+ROCm支持矩阵
AMD ROCm支持的操作系统与硬件信息,见表2-12。
表2-12 AMD ROCm支持的操作系统与硬件信息
|
PyTorch版本 |
ROCm版本 |
说明 |
|
2.1.2 |
6.1.3 |
官方生产支持。可从AMD.com获取。 |
|
2.5+/Nightly |
6.1 |
可从PyTorch.org获取夜间版本,未经AMD广泛测试。 |
|
2.3/Stable |
6.0 |
Radeon 7000系列不支持。 |
3. 局限性
Radeon™PRO系列图形卡不是为数据中心使用而设计的,也不建议使用GD-239。在数据中心设置中使用可能会对可管理性、效率、可靠性和/或性能产生不利影响。
ROCm在任何移动SKU上都不受官方支持。
4. 多GPU配置
在Windows Linux子系统(WSL)[n1] [2] 环境中的ROCm中,由于此时对Radeon™WSL配置上的ROCm™验证有限,因此确定了常见错误和适用建议。
ROCm 6.1.3版本仅限于对WSL配置的预览支持。[3]
5. ROCm smi支持
由于WSL架构对原生Linux用户内核界面(UKI)的限制,不支持rocm-smi,见表2-13。
表2-13 WSL架构对原生Linux用户内核界面(UKI)的限制,不支持rocm-smi[n4] [5]
|
由于WSL架构对原生Linux用户内核界面(UKI)的限制,不支持rocm-smi |
|
|
问题 |
局限性 |
|
UKI目前不支持rocm-smi |
目前不支持: 1)主动计算进程 2)GPU利用率 3)可修改的状态特征 |
6. 在虚拟环境中运行PyTorch
在虚拟环境中运行PyTorch,需要手动libhsa-runtime64.so更新。
当使用WSL用例和hsa-runtime-rocr4wsl-amdgpu包(与PyTorch轮子一起安装)时,用户需要更新到WSL兼容的运行库。
7. 解决方案
输入以下命令:
location=`pip show torch | grep Location | awk -F ": " '{print $2}'`
cd ${location}/torch/lib/
rm libhsa-runtime64.so*
cp /opt/rocm/lib/libhsa-runtime64.so.1.2 libhsa-runtime64.so

浙公网安备 33010602011771号