摘要: 利用MLIR实现矩阵乘法的高性能GPU码生成:一些早期结果 介绍了使用MLIR编译器基础设施在NVIDIA GPU上针对张量核生成代码的一些早期结果。当今高性能深度学习的最先进技术主要是由高度调优的库驱动的。这些库通常是由专业程序员手工优化与调优的,他们使用低级抽象,付出了巨大的努力。对于类似的硬件 阅读全文
posted @ 2024-04-20 04:59 吴建明wujianming 阅读(12) 评论(0) 推荐(0) 编辑