2025 年 9月 21 日随笔档案 - deephub

2025年9月21日

摘要：推理型大语言模型现在确实火了。这类模型的特点是会先对问题做充分思考，然后再给出答案，而不是直接回复。虽然早期训练推理型 LLM 的方法多半被各家公司当作核心机密，但最近的DeepSeek-R1、DeepSeekMath、Kimi-k1.5 和 DAPO 这些项目都公开了相关流程。这些方法让 LL 阅读全文

posted @ 2025-09-21 20:10 deephub 阅读(33) 评论(0) 推荐(0)

deephub

overfit深度学习

公告