会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
BobHuang
首页
新随笔
联系
管理
2025年7月10日
CUDA黑魔法:假装CUTLASS库
摘要: 摘要:很简单的一个黑魔法,只要在你的函数名前加上cutlass_,假装是CUTLASS库,有可能获得一定的性能提升。 我发现这个问题来源于Triton这笔commitade3d49 这不是在开玩笑,代码里真有。在FP8提升了 150 TFLOPS 那我们根据这个commit去build Triton
阅读全文
posted @ 2025-07-10 22:25 暴力都不会的蒟蒻
阅读(39)
评论(0)
推荐(0)
公告