摘要:
目录一、结论先行(面试版)二、三种方式对比(为什么要结合)1️⃣ 纯人工标注(理论最干净,实际不可规模化)2️⃣ 纯大模型自动标注(快,但风险极高)3️⃣ 工业标准做法:LLM 预标注 + 人工校验(主流)三、工业级混合标注流程(一步一步)Step 1:从生产中捞数据Step 2:大模型做预标注(P 阅读全文
posted @ 2026-01-14 09:44
向着朝阳
阅读(80)
评论(0)
推荐(0)
摘要:
目录一、先明确:这个指标用来干什么二、核心定义(推荐口径)三、工程加工的标准拆解1️⃣ 会话切分(Session / Window)2️⃣ Query 语义归一(非常关键)3️⃣ 相似度判定规则方案 A:Embedding 相似度(主流)方案 B:Intent 级别(更稳)4️⃣ “反复”的判定条件 阅读全文
posted @ 2026-01-14 09:01
向着朝阳
阅读(16)
评论(0)
推荐(0)

浙公网安备 33010602011771号