2025 年 2月 7 日随笔档案 - 遇健李的幸运

2025年2月7日

DeepSeek-R1 技术全景解析：从原理到实践的“炼金术配方” ——附多阶段训练流程图与核心误区澄清

摘要：字数：约3200字｜预计阅读时间：8分钟（调试着R1的API接口，看着控制台瀑布般流淌的思维链日志）此刻我仿佛看到AlphaGo的棋谱在代码世界重生——这是属于推理模型的AlphaZero时刻。 DeepSeek 发布的 V3、R1-Zero、R1 三大模型，代表了一条从通用基座到专用推理的完整技阅读全文

posted @ 2025-02-07 22:29 遇健李的幸运阅读(4023) 评论(0) 推荐(9)

Leon-Algo

公告