摘要: 在 MLIR 中,处理 FA(FlashAttention) 这类算法极度复杂、硬件耦合度极高的算子,采用的是一套与其设计哲学完美契合的组合拳。 MLIR 的核心理念是渐进式降级(Progressive Lowering)和显式控制(Explicit Control)。因此,MLIR 不会试图靠一个 阅读全文
posted @ 2026-01-23 16:30 稳住·能赢 阅读(0) 评论(0) 推荐(0)