2025 年 8月 20 日随笔档案 - Johny_Zhao

2025年8月20日

摘要： LLaMA-Factory 是一个强大且高效的大语言模型（LLM）微调框架，支持多种微调方法（如 LoRA、QLoRA）、完整的训练流程（SFT、RM、PPO、DPO）以及丰富的模型和数据集支持，能帮助你在消费级显卡上高效微调大型语言模型。这份指南将带你从零开始，完成基于 Docker 的环境搭建阅读全文

posted @ 2025-08-20 00:25 Johny_Zhao 阅读(1622) 评论(0) 推荐(0)

深漂的城固娃

一个学编程的网管

公告