向着朝阳 - 博客园

2026年1月14日

摘要：目录一、先给精确定义（避免误解）正确表述应是：二、为什么稳定基线样本必须迭代1️⃣ 业务在变，基线不变 → 行为过时2️⃣ 首轮样本存在先天偏差3️⃣ 不吸收真实优秀行为，会拖慢模型上限三、那为什么又不能“快速更新”？典型灾难场景四、工业上的正确更新策略（重点）1️⃣ 稳定基线样本的更新频率2️⃣ 阅读全文

posted @ 2026-01-14 15:34 向着朝阳阅读(41) 评论(0) 推荐(0)

第一次上线和上线后优化的LoRA微调数据集的差异

摘要：目录【概括】稳定基线样本一、一句话总览（先给结论）二、第一次 LoRA 微调（冷启动 / 首次上线）1️⃣ 核心目标2️⃣ 数据来源3️⃣ 样本分布特征（非常关键）✅ 覆盖广、分布均衡4️⃣ 样本“质量”要求5️⃣ 首轮微调典型比例（示意）三、上线后持续优化 LoRA（迭代微调）1️⃣ 核心目标2️ 阅读全文

posted @ 2026-01-14 15:20 向着朝阳阅读(49) 评论(0) 推荐(0)

微调池的数据来源

摘要：目录一、训练池样本来源二、关键原则数据分布训练池样本来源及参考比例（工业经验）实务经验总结对，你说的完全正确。用户改善模型的效果，核心依赖高质量训练样本池子，而训练池的样本来源是多渠道的，不只是生产会话，还包括各种特殊事件。我帮你整理一下专业的来源分类：一、训练池样本来源来源类型说明典型阅读全文

posted @ 2026-01-14 11:53 向着朝阳阅读(50) 评论(0) 推荐(0)

如何做上线后要做到实时风险控制

摘要：目录三、工业里的正确做法：三层抽样结构第一层：事件触发型（不占比例，最高优先）触发条件（你列的全对）：第二层：风险权重抽样第三层：完全随机兜底（防未知）上线后要做到实时风险控制、快速止损、持续优化，形成闭环反馈。质检一旦发现高风险样本，会触发即时的运营或策略动作，比如回滚话术、调整兜底条件。把阅读全文

posted @ 2026-01-14 11:19 向着朝阳阅读(28) 评论(0) 推荐(0)

基于生产的数据生成评估Agent准确度的评测数据准备

摘要：目录Step 1：从生产中捞数据数据清洗切分成「会话样本」总结理解你提到的这一步，其实是在描述智能客服/对话系统数据工程中最基础的“数据预处理”阶段。我帮你拆解一下每个概念，让它更容易理解。 Step 1：从生产中捞数据意思是：从生产系统里把实际发生的对话事件、用户行为、系统回答等日志抽取出阅读全文

posted @ 2026-01-14 10:53 向着朝阳阅读(27) 评论(0) 推荐(0)

归因分析

摘要：目录一、概念：什么是归因 / 转化分析1️⃣ 归因（Attribution）2️⃣ 转化分析（Conversion Analysis）二、为什么需要 query + answer + 用户行为三、逻辑示例1️⃣ 会话归因2️⃣ 归因方式四、业务价值五、技术实现思路六、总结理解好的，我帮你把归因阅读全文

posted @ 2026-01-14 10:51 向着朝阳阅读(46) 评论(0) 推荐(0)

数据标注-不同场景标注

摘要：目录一、结论先行（面试版）二、三种方式对比（为什么要结合）1️⃣ 纯人工标注（理论最干净，实际不可规模化）2️⃣ 纯大模型自动标注（快，但风险极高）3️⃣ 工业标准做法：LLM 预标注 + 人工校验（主流）三、工业级混合标注流程（一步一步）Step 1：从生产中捞数据Step 2：大模型做预标注（P 阅读全文

posted @ 2026-01-14 09:44 向着朝阳阅读(152) 评论(0) 推荐(0)

智能客服-用户是否反复问同一个问题计算

摘要：目录一、先明确：这个指标用来干什么二、核心定义（推荐口径）三、工程加工的标准拆解1️⃣ 会话切分（Session / Window）2️⃣ Query 语义归一（非常关键）3️⃣ 相似度判定规则方案 A：Embedding 相似度（主流）方案 B：Intent 级别（更稳）4️⃣ “反复”的判定条件阅读全文

posted @ 2026-01-14 09:01 向着朝阳阅读(74) 评论(0) 推荐(0)

2026年1月13日

上线后智能体准确度评测

摘要：目录一、基本思路二、逐层评测优势三、工业实践注意点四、面试可说版本完全正确，这正是工业智能客服上线后的生产环境准确度评测标准做法，我帮你梳理成完整可执行、面试可说的工业流程：一、基本思路上线后的准确度评测不是用训练/测试集，而是真实生产数据抽样，确保模型在实际业务场景中表现符合要求。主要流程阅读全文

posted @ 2026-01-13 22:47 向着朝阳阅读(51) 评论(0) 推荐(0)

灰度/AB测试监控（高可用2）

摘要：目录一、灰度监控核心目标二、核心业务指标1️⃣ 成交/转化指标2️⃣ 用户行为指标3️⃣ 用户反馈指标三、风险指标四、监控流程1️⃣ 数据收集2️⃣ 指标统计与对比3️⃣ 监控周期4️⃣ 可视化与报警五、面试可说版本完全可以，而且这是工业级智能客服上线灰度最关键的一环：灰度不是只部署新版本，而是验阅读全文

posted @ 2026-01-13 22:40 向着朝阳阅读(57) 评论(0) 推荐(0)

aibi1

公告