摘要:
目录一、上线后持续微调的整体流程图(文本版)二、流程中每一段的「关键判断点」(面试加分)1️⃣ 问题暴露 ≠ 随机噪声2️⃣ 问题必须“被标签化”3️⃣ LoRA 训练不是“全新数据集”4️⃣ 上线后不是只看“总体指标”5️⃣ 合并进基线 ≠ 自动动作6️⃣ 基线是“分级演进的”三、你在面试中可以用 阅读全文
posted @ 2026-01-15 08:48
向着朝阳
阅读(15)
评论(0)
推荐(0)
摘要:
目录一、先给结论(核心判断逻辑)二、第一步:问题一定要“被结构化”(你说的标签是对的)1️⃣ 质检阶段不是只打 Accept / Reject2️⃣ 问题标签 ≠ intent / phase三、第二步:问题样本进入“问题池”,并绑定标签四、第三步:微调后,用“对照指标”验证是否真的解决1️⃣ 不是 阅读全文
posted @ 2026-01-15 08:36
向着朝阳
阅读(13)
评论(0)
推荐(0)
摘要:
目录一、先给明确结论(面试可直接用)二、为什么不能简单“全部合并到基线”1️⃣ 基线样本的角色 ≠ 问题样本三、工业上正确的做法:分层合并核心原则1️⃣ 问题样本的生命周期(非常关键)2️⃣ 什么时候可以并入基线?3️⃣ 哪些样本不应该并入基线(重点)四、实际训练时:基线是“动态演进的”常见做法五、 阅读全文
posted @ 2026-01-15 08:31
向着朝阳
阅读(8)
评论(0)
推荐(0)

浙公网安备 33010602011771号