意图识别-小模型(MiniLM)+大模型


好的,我帮你整理出一份工业级、可落地的 MiniLM + LLM 兜底意图识别方案,完全基于刚刚修正的逻辑,包括 单意图 / 多意图判定、敏感等级、自动执行/兜底流程,方便直接用于架构设计或开发。


工业级智能客服意图识别方案:MiniLM + LLM 兜底

1. 系统目标

  • 高并发、低延迟、可扩展
  • 支持中文、英文、多意图、多标签
  • 风险可控:合同、金融、法律等高敏感 query 不直接执行
  • 自动缓存高置信度意图,降低重复计算

2. 标签体系设计

每个意图包含:

字段 含义
intent_id 唯一标签 ID
description 语义描述文本,用于 embedding
risk_level 风险等级:LOW / MED / HIGH
auto_execute 是否允许自动执行业务(LOW 可执行,MED/HIGH 不可)

示例:

{
  "intent_id": "REFUND",
  "description": "用户申请退款、退钱、取消订单后的资金退回",
  "risk_level": "MED",
  "auto_execute": false
}

3. 流程步骤

Step 1:MiniLM embedding → Top-K 意图候选

  • query → MiniLM 生成 embedding
  • 计算与标签 embedding 的 cosine similarity
  • 取 Top-K (K=3~5)
如果你有 6 个 intent
那么 1 条用户 query
就会 分别与这 6 个 intent 的描述做相似度计算
得到 6 个 similarity 分数
排序 → 取 Top-1 / Top-2(也就是 s1 / s2)

Step 2:单意图 / 多意图判定

  • 获取 Top-1、Top-2 相似度:s1, s2
  • 计算 margin = s1 - s2
  • 判定规则:
if s1 >= T1 and s2 < T2 or margin > Δ:
    单意图
else:
    多意图

推荐阈值:

  • T1 (Top-1 相似度) = 0.88~0.92
  • T2 (Top-2 相似度) = 0.82
  • Δ (margin) = 0.05~0.1

解释:

  • 单意图 → Top-1 明显高于其他意图
  • 多意图 → Top-1 与 Top-2 相近 → 拆分处理

Step 3:敏感度闸门(Risk Gate)

  • 根据 Top-1 或多意图标签 metadata 判断风险等级

  • 风险等级控制自动执行逻辑:

    • LOW → 可自动执行
    • MED → 结构化 LLM 处理 / 审核
    • HIGH → LLM 说明 + 人工兜底

Step 4:决策执行

单意图

风险等级 执行方式
LOW 自动触发业务流程 / 函数调用
MED LLM 结构化处理 → 生成意图 + 建议 → 人工或半自动执行
HIGH LLM 说明 / 人工确认,不自动执行

多意图

  • 无论风险等级如何,都进入 LLM 结构化处理

  • LLM 输出:

    • 拆分的子意图
    • 对应业务建议
    • 提示人工确认

Step 5:缓存 / 回路优化

  • 高置信度单意图可缓存 query → intent
  • 多意图或 MED/HIGH 不缓存,避免错误扩散
  • LLM 结果可作为训练/优化样本,闭环回流 MiniLM embedding 或未来微调

4. 工程化要点

模块 建议实践
MiniLM embedding 支持中文、英文、多意图,batch 化计算降低延迟
多意图判定 Top-K + margin + 阈值,可调优
风险等级 所有高敏感标签必须标注 risk_level,确保自动执行安全
LLM 兜底 仅处理低置信度、多意图或高风险 query,避免成本浪费
缓存 只缓存高置信单意图,降低重复计算
数据闭环 LLM 输出、人工复核结果 → 更新标签 embedding 或微调 MiniLM

5. 流程可视化(文字版)

User Query
   ↓
MiniLM embedding → Top-K 意图
   ↓
┌─────────────┐
│ 单意图?     │
└─────────────┘
   ├── Yes ────► 判断风险等级
   │             ├─ LOW  → 自动执行
   │             ├─ MED  → LLM 结构化处理
   │             └─ HIGH → LLM 说明 / 人工兜底
   └── No ─────► 多意图 → LLM 结构化处理 → 拆分意图 + 人工确认

6. 阶段性指标(工业级参考)

指标 推荐值 / 指标
Top-1 similarity ≥ 0.88~0.92
Top-2 similarity ≥ 0.82
margin (s1-s2) 0.05~0.1
高置信度缓存命中率 ≥ 70%
低置信/高风险走 LLM 比例 ≤ 30%
响应延迟 embedding + Top-K < 50ms, LLM 兜底 < 500ms(可异步)

总结

  1. MiniLM → 快速、高并发意图召回 + embedding similarity + margin 判定
  2. 单意图 + LOW → 自动执行
  3. 多意图 / 中高风险 → LLM 结构化处理 + 人工复核
  4. 缓存和闭环保证工业可用性
  5. 可扩展到中文 / 英文 / 多意图 / 高敏感场景
posted @ 2026-01-09 22:00  向着朝阳  阅读(150)  评论(0)    收藏  举报