ROCm运行时架构

ROCm运行时架构
ROCm运行时架构OpenCL Demo,如图1-33所示。
 
图1-33 ROCm运行时架构OpenCL Demo
OpenMP测试:
进入目录/opt/rocm-5.1.0/llvm/examples/openmp/veccopy,执行如下编译:
/opt/rocm-5.1.0/llvm/bin/clang -O3 -target x86_64-pc-linux-gnu -fopenmp -fopenmp-targets=amdgcn-amd-amdhsa -Xopenmp-target=amdgcn-amd-amdhsa -march=gfx908   veccopy.c -o veccopy
rocm_agent_enumerator用于发现支持AMD HSA的智能体设备,测试环境发现了两个智能体,分别是CPU和GPU。测试使用的是gfx908,如图1-34所示。
 
图1-34 测试使用gfx908测试发现gfx000和gfx90c
编译提示用错了卸载架构, 所以可能无法将计算卸载到设备。不过没关系,不影响测试,如图1-35所示。
 
图1-35 编译提示用错了卸载架构提示
openmp的计算实际上也是卸载到GPU上运行的,如图1-36所示。
 
图1-36 openmp的计算是卸载到GPU上运行的
posted @ 2025-04-07 04:53  吴建明wujianming  阅读(32)  评论(0)    收藏  举报