摘要: DeepSeek数学推理蒸馏赛上分笔记 摘要:本文分享基于DeepSeek-R1模型的数学推理蒸馏方案,通过CoT数据生成、分层蒸馏与轻量化部署,实现竞赛评分指标(AS/CQS/ES/MLS)的协同优化。 一、赛题核心挑战拆解 多维度评分机制 AS(答案准确率):答案正确性(权重30%) CQS(推 阅读全文
posted @ 2025-07-26 23:52 叶谨之 阅读(80) 评论(0) 推荐(0)