摘要: ROCm运行时架构 ROCm运行时架构OpenCL Demo,如图1-33所示。 图1-33 ROCm运行时架构OpenCL Demo OpenMP测试: 进入目录/opt/rocm-5.1.0/llvm/examples/openmp/veccopy,执行如下编译: /opt/rocm-5.1.0 阅读全文
posted @ 2025-04-07 04:53 吴建明wujianming 阅读(32) 评论(0) 推荐(0)
摘要: 开发OpenCL内核测试用例 前面的例子只有主机侧的代码,没有GPU运行的代码,实际上没有调用AMDGPU的异构计算能力,参考网上的代码,写一个实现两个一维向量加和的内核,投到AMDGPU上得到计算结果: #include <stdio.h> #include <stdlib.h> #include 阅读全文
posted @ 2025-04-07 04:48 吴建明wujianming 阅读(44) 评论(0) 推荐(0)
摘要: 基于AMDGPU如何运行OpenCL测试用例 参考CPU算例的OpenCL的例子,写一个OpenCL的helloworld demo,这个并不太难,因为OpenCL是开源机构Khronos Group定义的标准,在这个标准下所有的头文件,运行时标准等都是定义好的,所以源码级没有太多改动,基本上拷贝过 阅读全文
posted @ 2025-04-07 04:42 吴建明wujianming 阅读(60) 评论(0) 推荐(0)
摘要: AMDGPU对CUDA支持方式的分析 实现方式是针对HIP API(Heterogeneous-Computing Interface for Portability)做CUDA的接口套壳,即将cuda的API接口作为标准接口,用AMD ROCm实现cuda的API(目的就是保证对外的API与CUD 阅读全文
posted @ 2025-04-07 04:36 吴建明wujianming 阅读(182) 评论(0) 推荐(0)
摘要: ROCm平台简单分析 在启动docker的测试命令中,传入一个设备参数--device=/dev/kfd,转到DOCKER环境,kfd表示AMDGPU异构计算的GPU设备驱动(KMD)的设备节点,它是用户操作GPU的基础。AMD GPU设备驱动流程简单分析,如图1-24所示。 图1-24 AMD G 阅读全文
posted @ 2025-04-07 04:33 吴建明wujianming 阅读(144) 评论(0) 推荐(0)
摘要: 6本书推荐《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《MLIR编译器原理与实践》已经出版,京东、淘宝天 阅读全文
posted @ 2025-04-07 04:28 吴建明wujianming 阅读(50) 评论(0) 推荐(0)