摘要: Minimind-一个开源LLM项目的代码分析1:模型结构 如果你是一名刚接触大语言模型(LLM)的初学者,很可能会在社交媒体上看到这样一个项目——MiniMind 。 这个项目实现了一个参数规模较小但功能完整的 LLM,涵盖了预训练、LoRA 微调、SFT、蒸馏以及基于人类反馈的强化学习(RLHF)等多个模块,可以说是非常难得的入门教材。 MiniMind 阅读全文
posted @ 2025-09-20 21:37 bradinz 阅读(398) 评论(2) 推荐(0)