上一页 1 ··· 87 88 89 90 91 92 93 94 95 ··· 367 下一页
摘要: Khronos现行标准 Khronos标准与计算、嵌入式、视觉和安全关键型市场最相关。 Khronos现行标准,如图1-3所示。 图1-3 Khronos现行标准 Khronos计算加速标准 Khronos计算加速标准,如图1-4所示。 图1-4 Khronos计算加速标准 机器学习加速API Kh 阅读全文
posted @ 2025-01-01 03:45 吴建明wujianming 阅读(300) 评论(0) 推荐(0)
摘要: Khronos将软件连接到硅片 Khronos是开放、免费的互操作性标准,利用GPU、XR和多处理器3D图形、增强和虚拟现实、并行编程、推理和视觉加速驱动的标准组织,向任何公司开放知识产权框架。 Khronos组织成立于2000年,约200名会员,其中,美洲约占40%、欧洲约占30%、亚洲约占30% 阅读全文
posted @ 2025-01-01 03:40 吴建明wujianming 阅读(167) 评论(0) 推荐(0)
摘要: 6本书推荐《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《MLIR编译器原理与实践》已经出版,京东、淘宝天 阅读全文
posted @ 2025-01-01 03:37 吴建明wujianming 阅读(32) 评论(0) 推荐(0)
摘要: OpenCL设备端并行执行内核 Vortex存储库的tests/OpenCL目录中有OpenCL测试程序。OpenCL程序分为主机代码[cc|cpp]和设备代码kernel.cl。 OpenCL通过在设备端并行执行内核来加快速度。在tests/opencl/sgemm中的代码作为一个具体的例子。代码 阅读全文
posted @ 2024-12-31 05:11 吴建明wujianming 阅读(39) 评论(0) 推荐(0)
摘要: OpenCL流程分析与示例 OpenCL兼容RISC-V的GPGPU示例,如图1-38所示。 图1-38 OpenCL兼容RISC-V的GPGPU示例 OpenCL流程分析与示例,如图1-39所示。 图1-39 OpenCL流程分析与示例 阅读全文
posted @ 2024-12-31 05:08 吴建明wujianming 阅读(10) 评论(0) 推荐(0)
摘要: 6本书推荐《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《MLIR编译器原理与实践》已经出版,京东、淘宝天 阅读全文
posted @ 2024-12-31 05:03 吴建明wujianming 阅读(22) 评论(0) 推荐(0)
摘要: OpenCL工作组织结构 OpenCL工作组织结构,如图1-35所示。 图1-35 OpenCL工作组织结构 Khronos工作组织结构与注册 Khronos工作组织结构与注册,如图1-36所示。 图1-36 Khronos工作组织结构与注册 OpenCL使用C++开发 1)开源编译器前端 替代Op 阅读全文
posted @ 2024-12-30 03:50 吴建明wujianming 阅读(45) 评论(0) 推荐(0)
摘要: 执行OpenCL程序流程 1)内核程序是可执行代码的基本单元(类似于C函数)。 2)OpenCL程序是内核和函数的集合。 3)主机应用程序使用OpenCL命令队列,向设备发送内核和数据传输功能。 4)通过将命令排入队列,内核和数据传输功能可以与主机代码,进行异步并行执行。 5)作为一种开放标准,Op 阅读全文
posted @ 2024-12-30 03:45 吴建明wujianming 阅读(73) 评论(0) 推荐(0)
摘要: 6本书推荐《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《MLIR编译器原理与实践》已经出版,京东、淘宝天 阅读全文
posted @ 2024-12-30 03:38 吴建明wujianming 阅读(97) 评论(0) 推荐(0)
摘要: Intel oneAPI DPC++和UXL基础 1)Intel oneAPI DPC++符合SYCL 2020规范 ①统一共享内存、并行约简、工作组算法、类模板。 ②论证推理、访问优化、扩展互操作性等。 2)UXL统一加速基础 ①加速计算开放生态系统。 ②工具和库。 ③编译器和开发工具。 ④API 阅读全文
posted @ 2024-12-29 03:41 吴建明wujianming 阅读(53) 评论(0) 推荐(0)
上一页 1 ··· 87 88 89 90 91 92 93 94 95 ··· 367 下一页