LoRA 微调参数调优流程

核心原则：一次只改一个变量，先确认最重要的容量参数（rank + target module）是否合理，再微调其他超参

在 LoRA 微调初始阶段，我们先用默认值设置 a、dropout、learning rate，先验证 rank 和 target module 的合理性。待训练曲线和验证表现正常后，再对学习
率、dropout 或 scaling 进行微调

一、准备阶段：评估任务 & 数据

评估任务复杂度
- 输出结构、语义歧义、分布偏移、决策边界等
- 例：客服意图分类 → 中等复杂
确定训练数据量
- 数据量 = 复杂度 × 期望泛化
- 检查数据质量：标注一致性、长尾覆盖、错别字、分布偏移
初步选择 LoRA 配置（默认保守策略）
- rank r：根据数据量与复杂度选中等值（如 8~16）
- target modules：核心 Q/V + 顶层 2~4 层 FFN
- a（LoRA scaling）：默认 1.0 （初步选参，取默认值即可）
- dropout：默认 0.05~0.1（初步选参，取默认值即可）
- learning rate：默认较小，如 1e-4~5e-4（初步选参，取默认值即可）

目的：先有一个 安全可训练的起点，不会一上来就过拟合或梯度爆炸

运行短轮（1~3 epoch 或少量 step）观察指标
- 训练 loss：是否正常下降
- 验证 loss / 准确率：是否过拟合
- 是否有梯度异常、nan、loss 振荡
观察曲线判断 rank 是否合适
- train loss 快速降到接近 0，但 val loss 高 → rank 太大 → 过拟合
- train loss 降不下去 → rank 太小或模块少 → 欠拟合
观察模块选择效果
- 只选 Q/V → loss 收敛慢，val acc 不理想 → 可以增加顶层 FFN
- 全模块 → val acc 波动 → rank 或层数过多，需要控制

以 单变量调优 + 观察曲线 为主：

原则：一次只改一个参数，观察 loss/acc 曲线变化，再改下一个

posted @ 2026-01-25 21:50 向着朝阳阅读(36) 评论(0) 收藏举报

刷新页面返回顶部