意图识别-小模型(MiniLM)+大模型
目录
好的,我帮你整理出一份工业级、可落地的 MiniLM + LLM 兜底意图识别方案,完全基于刚刚修正的逻辑,包括 单意图 / 多意图判定、敏感等级、自动执行/兜底流程,方便直接用于架构设计或开发。
工业级智能客服意图识别方案:MiniLM + LLM 兜底
1. 系统目标
- 高并发、低延迟、可扩展
- 支持中文、英文、多意图、多标签
- 风险可控:合同、金融、法律等高敏感 query 不直接执行
- 自动缓存高置信度意图,降低重复计算
2. 标签体系设计
每个意图包含:
| 字段 | 含义 |
|---|---|
intent_id |
唯一标签 ID |
description |
语义描述文本,用于 embedding |
risk_level |
风险等级:LOW / MED / HIGH |
auto_execute |
是否允许自动执行业务(LOW 可执行,MED/HIGH 不可) |
示例:
{
"intent_id": "REFUND",
"description": "用户申请退款、退钱、取消订单后的资金退回",
"risk_level": "MED",
"auto_execute": false
}
3. 流程步骤
Step 1:MiniLM embedding → Top-K 意图候选
- query → MiniLM 生成 embedding
- 计算与标签 embedding 的 cosine similarity
- 取 Top-K (K=3~5)
如果你有 6 个 intent
那么 1 条用户 query
就会 分别与这 6 个 intent 的描述做相似度计算
得到 6 个 similarity 分数
排序 → 取 Top-1 / Top-2(也就是 s1 / s2)
Step 2:单意图 / 多意图判定
- 获取 Top-1、Top-2 相似度:
s1,s2 - 计算 margin = s1 - s2
- 判定规则:
if s1 >= T1 and s2 < T2 or margin > Δ:
单意图
else:
多意图
推荐阈值:
- T1 (Top-1 相似度) = 0.88~0.92
- T2 (Top-2 相似度) = 0.82
- Δ (margin) = 0.05~0.1
解释:
- 单意图 → Top-1 明显高于其他意图
- 多意图 → Top-1 与 Top-2 相近 → 拆分处理
Step 3:敏感度闸门(Risk Gate)
-
根据 Top-1 或多意图标签 metadata 判断风险等级
-
风险等级控制自动执行逻辑:
- LOW → 可自动执行
- MED → 结构化 LLM 处理 / 审核
- HIGH → LLM 说明 + 人工兜底
Step 4:决策执行
单意图
| 风险等级 | 执行方式 |
|---|---|
| LOW | 自动触发业务流程 / 函数调用 |
| MED | LLM 结构化处理 → 生成意图 + 建议 → 人工或半自动执行 |
| HIGH | LLM 说明 / 人工确认,不自动执行 |
多意图
-
无论风险等级如何,都进入 LLM 结构化处理
-
LLM 输出:
- 拆分的子意图
- 对应业务建议
- 提示人工确认
Step 5:缓存 / 回路优化
- 高置信度单意图可缓存 query → intent
- 多意图或 MED/HIGH 不缓存,避免错误扩散
- LLM 结果可作为训练/优化样本,闭环回流 MiniLM embedding 或未来微调
4. 工程化要点
| 模块 | 建议实践 |
|---|---|
| MiniLM embedding | 支持中文、英文、多意图,batch 化计算降低延迟 |
| 多意图判定 | Top-K + margin + 阈值,可调优 |
| 风险等级 | 所有高敏感标签必须标注 risk_level,确保自动执行安全 |
| LLM 兜底 | 仅处理低置信度、多意图或高风险 query,避免成本浪费 |
| 缓存 | 只缓存高置信单意图,降低重复计算 |
| 数据闭环 | LLM 输出、人工复核结果 → 更新标签 embedding 或微调 MiniLM |
5. 流程可视化(文字版)
User Query
↓
MiniLM embedding → Top-K 意图
↓
┌─────────────┐
│ 单意图? │
└─────────────┘
├── Yes ────► 判断风险等级
│ ├─ LOW → 自动执行
│ ├─ MED → LLM 结构化处理
│ └─ HIGH → LLM 说明 / 人工兜底
└── No ─────► 多意图 → LLM 结构化处理 → 拆分意图 + 人工确认
6. 阶段性指标(工业级参考)
| 指标 | 推荐值 / 指标 |
|---|---|
| Top-1 similarity | ≥ 0.88~0.92 |
| Top-2 similarity | ≥ 0.82 |
| margin (s1-s2) | 0.05~0.1 |
| 高置信度缓存命中率 | ≥ 70% |
| 低置信/高风险走 LLM 比例 | ≤ 30% |
| 响应延迟 | embedding + Top-K < 50ms, LLM 兜底 < 500ms(可异步) |
✅ 总结
- MiniLM → 快速、高并发意图召回 + embedding similarity + margin 判定
- 单意图 + LOW → 自动执行
- 多意图 / 中高风险 → LLM 结构化处理 + 人工复核
- 缓存和闭环保证工业可用性
- 可扩展到中文 / 英文 / 多意图 / 高敏感场景

浙公网安备 33010602011771号