摘要: OpenCL设备端并行执行内核 Vortex存储库的tests/OpenCL目录中有OpenCL测试程序。OpenCL程序分为主机代码[cc|cpp]和设备代码kernel.cl。 OpenCL通过在设备端并行执行内核来加快速度。在tests/opencl/sgemm中的代码作为一个具体的例子。代码 阅读全文
posted @ 2024-12-31 05:11 吴建明wujianming 阅读(39) 评论(0) 推荐(0)
摘要: OpenCL流程分析与示例 OpenCL兼容RISC-V的GPGPU示例,如图1-38所示。 图1-38 OpenCL兼容RISC-V的GPGPU示例 OpenCL流程分析与示例,如图1-39所示。 图1-39 OpenCL流程分析与示例 阅读全文
posted @ 2024-12-31 05:08 吴建明wujianming 阅读(10) 评论(0) 推荐(0)
摘要: 6本书推荐《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《MLIR编译器原理与实践》已经出版,京东、淘宝天 阅读全文
posted @ 2024-12-31 05:03 吴建明wujianming 阅读(22) 评论(0) 推荐(0)