摘要: https://github.com/QwenLM/Qwen3 核心创新: Qwen3 的“思维模式融合”是通过以下几个关键技术手段实现的: 持续监督微调(SFT) 在已经具备推理能力的模型(经过推理RL训练)上,继续用包含“思维”和“非思维”两类数据的混合数据集进行SFT。 “思维”数据:用第二阶 阅读全文
posted @ 2025-05-15 10:05 一介布衣、 阅读(2045) 评论(0) 推荐(0)