摘要: 如图所示 阅读全文
posted @ 2025-02-17 15:26 cjh502 阅读(1) 评论(0) 推荐(0)
摘要: KTransformers事件分析 一、技术突破:从“云端垄断”到“本地普惠” 1. 单卡运行千亿参数模型 KTransformers首次支持在单张24GB显存的RTX 4090显卡上运行DeepSeek-R1/V3的671B参数满血版,预处理速度达286 tokens/s,推理生成速度达14 to 阅读全文
posted @ 2025-02-17 08:54 cjh502 阅读(261) 评论(0) 推荐(0)