意图识别-小模型（MiniLM）+大模型

工业级智能客服意图识别方案：MiniLM + LLM 兜底

好的，我帮你整理出一份工业级、可落地的 MiniLM + LLM 兜底意图识别方案，完全基于刚刚修正的逻辑，包括 单意图 / 多意图判定、敏感等级、自动执行/兜底流程，方便直接用于架构设计或开发。

工业级智能客服意图识别方案：MiniLM + LLM 兜底

1. 系统目标

高并发、低延迟、可扩展
支持中文、英文、多意图、多标签
风险可控：合同、金融、法律等高敏感 query 不直接执行
自动缓存高置信度意图，降低重复计算

2. 标签体系设计

每个意图包含：

字段	含义
`intent_id`	唯一标签 ID
`description`	语义描述文本，用于 embedding
`risk_level`	风险等级：LOW / MED / HIGH
`auto_execute`	是否允许自动执行业务（LOW 可执行，MED/HIGH 不可）

示例：

{
  "intent_id": "REFUND",
  "description": "用户申请退款、退钱、取消订单后的资金退回",
  "risk_level": "MED",
  "auto_execute": false
}

3. 流程步骤

Step 1：MiniLM embedding → Top-K 意图候选

query → MiniLM 生成 embedding
计算与标签 embedding 的 cosine similarity
取 Top-K (K=3~5)

如果你有 6 个 intent
那么 1 条用户 query
就会 分别与这 6 个 intent 的描述做相似度计算
得到 6 个 similarity 分数
排序 → 取 Top-1 / Top-2（也就是 s1 / s2）

Step 2：单意图 / 多意图判定

获取 Top-1、Top-2 相似度：s1, s2
计算 margin = s1 - s2
判定规则：

if s1 >= T1 and s2 < T2 or margin > Δ:
    单意图
else:
    多意图

推荐阈值：

T1 (Top-1 相似度) = 0.88~0.92
T2 (Top-2 相似度) = 0.82
Δ (margin) = 0.05~0.1

解释：

单意图 → Top-1 明显高于其他意图
多意图 → Top-1 与 Top-2 相近 → 拆分处理

Step 3：敏感度闸门（Risk Gate）

根据 Top-1 或多意图标签 metadata 判断风险等级
风险等级控制自动执行逻辑：
- LOW → 可自动执行
- MED → 结构化 LLM 处理 / 审核
- HIGH → LLM 说明 + 人工兜底

Step 4：决策执行

单意图

风险等级	执行方式
LOW	自动触发业务流程 / 函数调用
MED	LLM 结构化处理 → 生成意图 + 建议 → 人工或半自动执行
HIGH	LLM 说明 / 人工确认，不自动执行

多意图

无论风险等级如何，都进入 LLM 结构化处理
LLM 输出：
- 拆分的子意图
- 对应业务建议
- 提示人工确认

Step 5：缓存 / 回路优化

高置信度单意图可缓存 query → intent
多意图或 MED/HIGH 不缓存，避免错误扩散
LLM 结果可作为训练/优化样本，闭环回流 MiniLM embedding 或未来微调

4. 工程化要点

模块	建议实践
MiniLM embedding	支持中文、英文、多意图，batch 化计算降低延迟
多意图判定	Top-K + margin + 阈值，可调优
风险等级	所有高敏感标签必须标注 risk_level，确保自动执行安全
LLM 兜底	仅处理低置信度、多意图或高风险 query，避免成本浪费
缓存	只缓存高置信单意图，降低重复计算
数据闭环	LLM 输出、人工复核结果 → 更新标签 embedding 或微调 MiniLM

5. 流程可视化（文字版）

User Query
   ↓
MiniLM embedding → Top-K 意图
   ↓
┌─────────────┐
│ 单意图？     │
└─────────────┘
   ├── Yes ────► 判断风险等级
   │             ├─ LOW  → 自动执行
   │             ├─ MED  → LLM 结构化处理
   │             └─ HIGH → LLM 说明 / 人工兜底
   └── No ─────► 多意图 → LLM 结构化处理 → 拆分意图 + 人工确认

6. 阶段性指标（工业级参考）

指标	推荐值 / 指标
Top-1 similarity	≥ 0.88~0.92
Top-2 similarity	≥ 0.82
margin (s1-s2)	0.05~0.1
高置信度缓存命中率	≥ 70%
低置信/高风险走 LLM 比例	≤ 30%
响应延迟	embedding + Top-K < 50ms, LLM 兜底 < 500ms（可异步）

✅ 总结

MiniLM → 快速、高并发意图召回 + embedding similarity + margin 判定
单意图 + LOW → 自动执行
多意图 / 中高风险 → LLM 结构化处理 + 人工复核
缓存和闭环保证工业可用性
可扩展到中文 / 英文 / 多意图 / 高敏感场景

posted @ 2026-01-09 22:00 向着朝阳阅读(287) 评论(0) 收藏举报

刷新页面返回顶部

aibi1

意图识别-小模型（MiniLM）+大模型

工业级智能客服意图识别方案：MiniLM + LLM 兜底

1. 系统目标

2. 标签体系设计

3. 流程步骤

Step 1：MiniLM embedding → Top-K 意图候选

Step 2：单意图 / 多意图判定

Step 3：敏感度闸门（Risk Gate）

Step 4：决策执行

单意图

多意图

Step 5：缓存 / 回路优化

4. 工程化要点

5. 流程可视化（文字版）

6. 阶段性指标（工业级参考）

✅ 总结

公告