摘要: LLaMA-Factory 是一个强大且高效的大语言模型(LLM)微调框架,支持多种微调方法(如 LoRA、QLoRA)、完整的训练流程(SFT、RM、PPO、DPO)以及丰富的模型和数据集支持,能帮助你在消费级显卡上高效微调大型语言模型。 这份指南将带你从零开始,完成基于 Docker 的环境搭建 阅读全文
posted @ 2025-08-20 00:25 Johny_Zhao 阅读(1622) 评论(0) 推荐(0)