摘要: 一句话结论:值得重点追踪。这不是“又一个写代码助手”,而是把 CUDA Kernel 生成推向“可规模化训练、可工程落地”的新台阶。 A. 研究问题 LLM 生成 CUDA Kernel 已经可用,但在真实高性能场景里,常见问题是:速度不稳、性能上限不高、工程可控性不足。 这篇工作要解决的是:能不能 阅读全文
posted @ 2026-03-03 20:30 AI系统笔记 阅读(7) 评论(0) 推荐(0)