摘要: 开源项目推荐 FlashMLA DeepSeek 于北京时间 2025 年 2 月 24 日上午 9 点正式开源了 FlashMLA 项目。FlashMLA 是专为 NVIDIA Hopper 架构 GPU(如 H100、H800)优化的高效多头潜在注意力(MLA)解码内核,旨在提升大模型推理性能, 阅读全文
posted @ 2025-02-24 17:17 kubesphere 阅读(87) 评论(0) 推荐(0)