会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
稳住·能赢
讲人话,都能懂。
首页
新随笔
联系
管理
2026年1月23日
MLIR如何像Triton一样高效实现Attention?
摘要: 在 MLIR 中,处理 FA(FlashAttention) 这类算法极度复杂、硬件耦合度极高的算子,采用的是一套与其设计哲学完美契合的组合拳。 MLIR 的核心理念是渐进式降级(Progressive Lowering)和显式控制(Explicit Control)。因此,MLIR 不会试图靠一个
阅读全文
posted @ 2026-01-23 16:30 稳住·能赢
阅读(0)
评论(0)
推荐(0)
公告