Radeon GPU上使用ROCm一些技术点


| 操作系统 | 内核 | 支持 | 
| Ubuntu® 22.04.4带HWE的桌面版本 带硬件的Ubuntu®22.04.4桌面版, | Ubuntu内核6.5 | 是 | 
| PyTorch版本 | ROCm版本 | 说明 | 
| 2.1.2 | 6.1.3 | 官方生产支持。可从AMD.com获取 | 
| 2.5+/Nightly | 6.1 | 可从PyTorch.org获取夜间构建版本,未经AMD广泛测试 | 
| 2.3/Stable | 6.0 | Radeon 7000系列不支持 | 
4)INT8
12. ONNX + ROCm支持矩阵
ONNX版本、ROCm版本说明信息,见表2-10。
表2-10 ONNX版本、ROCm版本说明信息
| ONNX版本 | ROCm版本 | 说明 | 
| 1.17 | 6.1.3 | 官方生产支持。可从AMD.com获取。 | 
AI数据操作(ONNX)支持多种精度,例如:
1)FP32
2)FP16
3)INT8 (MIGraphX)
4)混合精度 (FP32/FP16)
14. TensorFlow+ROCm支持矩阵
Tensorflow版本、ROCm版本说明信息,见表2-11。
表2-11 Tensorflow版本、ROCm版本说明信息
| TensorFlow版本 | ROCm版本 | 说明 | 
| 2.15 | 6.1.3 | 官方生产支持。可从AMD.com获取。 | 
15. AI数据操作(TensoFlow)精度
AI数据操作(TensorFlow)支持多种精度,例如:
1)FP32
2)FP16
2.8.2 ROCm兼容矩阵(WSL)
1. ROCm 6.1.3
提供有关ROCm™组件、Radeon™GPU和适用于Windows Linux的Radeon软件®子系统(WSL)兼容性的信息。
要回滚以前版本的支持列表和安装说明[3] 。
1. GPU支持矩阵
AMD ROCm支持的操作系统与硬件信息,见表2-12。
表2-12 AMD ROCm支持的操作系统与硬件信息
| ROCm版本 | 适用于Linux®版本的Radeon™软件 | 适用于Windows版本的Radeon™软件 | 支持的AMD Radeon™硬件 | 
| 6.1.3 | 24.10.3 | AMD软件:适用于WSL 2的Adrenalin Edition™24.6.1 | AMD Radeon RX 7900 XTX | 
2. 框架+ROCm支持矩阵
查看PyTorch的ROCm支持矩阵。
PyTorch+ROCm支持矩阵
AMD ROCm支持的操作系统与硬件信息,见表2-12。
表2-12 AMD ROCm支持的操作系统与硬件信息
| PyTorch版本 | ROCm版本 | 说明 | 
| 2.1.2 | 6.1.3 | 官方生产支持。可从AMD.com获取。 | 
| 2.5+/Nightly | 6.1 | 可从PyTorch.org获取夜间版本,未经AMD广泛测试。 | 
| 2.3/Stable | 6.0 | Radeon 7000系列不支持。 | 
3. 局限性
Radeon™PRO系列图形卡不是为数据中心使用而设计的,也不建议使用GD-239。在数据中心设置中使用可能会对可管理性、效率、可靠性和/或性能产生不利影响。
ROCm在任何移动SKU上都不受官方支持。
4. 多GPU配置
在Windows Linux子系统(WSL)[n1] [2] 环境中的ROCm中,由于此时对Radeon™WSL配置上的ROCm™验证有限,因此确定了常见错误和适用建议。
ROCm 6.1.3版本仅限于对WSL配置的预览支持。[3]
5. ROCm smi支持
由于WSL架构对原生Linux用户内核界面(UKI)的限制,不支持rocm-smi,见表2-13。
表2-13 WSL架构对原生Linux用户内核界面(UKI)的限制,不支持rocm-smi[n4] [5]
| 由于WSL架构对原生Linux用户内核界面(UKI)的限制,不支持rocm-smi | |
| 问题 | 局限性 | 
| UKI目前不支持rocm-smi | 目前不支持: 1)主动计算进程 2)GPU利用率 3)可修改的状态特征 | 
6. 在虚拟环境中运行PyTorch
在虚拟环境中运行PyTorch,需要手动libhsa-runtime64.so更新。
当使用WSL用例和hsa-runtime-rocr4wsl-amdgpu包(与PyTorch轮子一起安装)时,用户需要更新到WSL兼容的运行库。
7. 解决方案
输入以下命令:
location=`pip show torch | grep Location | awk -F ": " '{print $2}'`
cd ${location}/torch/lib/
rm libhsa-runtime64.so*
cp /opt/rocm/lib/libhsa-runtime64.so.1.2 libhsa-runtime64.so
 
                    
                
 
                
            
         浙公网安备 33010602011771号
浙公网安备 33010602011771号