摘要:
如果你是一名刚接触大语言模型(LLM)的初学者,很可能会在社交媒体上看到这样一个项目——MiniMind 。 这个项目实现了一个参数规模较小但功能完整的 LLM,涵盖了预训练、LoRA 微调、SFT、蒸馏以及基于人类反馈的强化学习(RLHF)等多个模块,可以说是非常难得的入门教材。 MiniMind 阅读全文
如果你是一名刚接触大语言模型(LLM)的初学者,很可能会在社交媒体上看到这样一个项目——MiniMind 。 这个项目实现了一个参数规模较小但功能完整的 LLM,涵盖了预训练、LoRA 微调、SFT、蒸馏以及基于人类反馈的强化学习(RLHF)等多个模块,可以说是非常难得的入门教材。 MiniMind 阅读全文
posted @ 2025-09-20 21:37
bradinz
阅读(398)
评论(2)
推荐(0)

浙公网安备 33010602011771号