摘要: 资料来源:火山引擎-开发者社区2025 年 2 月28 日,DeepSeek 在其开源周最后一天压轴发布了自研的并行文件系统 Fire-Flyer File System,简称 3FS。该系统支撑了 DeepSeek V3&R1 模型训练、推理的全流程,在数据预处理、数据集加载、CheckPoint 阅读全文
posted @ 2025-03-28 11:43 财经一哥 阅读(11) 评论(0) 推荐(0)
摘要: 资料来源:火山引擎-开发者社区 本文详细介绍了如何通过 AIBrix 分布式推理平台实现 DeepSeek-R1 671B 的多节点部署。DeepSeek-R1 通过渐进式训练框架展现出优秀的逻辑推理能力 —— 在 6710 亿总参数量中,其动态激活的 370 亿参数与 128k 上下文窗口,使其在 阅读全文
posted @ 2025-03-28 11:41 财经一哥 阅读(34) 评论(0) 推荐(0)