智能客服及时降级策略(高可用1)
目录
面试总结
在工业智能客服系统中,Action 不是同质的。
我们对 Action 做分级管理:
- 核心业务动作(如退货处理)禁止直接关闭,只能通过转人工兜底;
- 中风险动作(如促销 CTA)可关闭或降低覆盖率;
- 低风险动作(如闲聊或轻度提醒)可以随意关闭或灰度。
每个 Action 都有类型、风险等级和对应的降级策略,从而保证业务安全同时允许灵活调整。
| 角色 | 在质检池里的责任 |
|---|---|
| 客服 / 质检 | 业务判定 + 风险归因 |
| 运营 | 即时止血 + 策略调整 |
| 工程 | 规则 / Prompt / KB 修复 |
| 算法 | 中长期模型改进 |
- 临时关闭某条话术 / 模板
- 对某类 query 直接强制转人工
- 回滚最近的 KB 更新
- 降低某些自动化覆盖
话术模板
同提示词,具备灰度能力
知识库
只有版本管理,一般不做灰度用户路由
提示词 版本,灰度,路由管理策略
一、整体架构思路
1️⃣ 提示词存储与管理
-
存储:把 Prompt 放到数据库(或配置中心),而不是写死在代码里
-
管理:提供管理后台页面,支持:
- 新建/修改 Prompt
- 设置灰度规则
- 设置生效范围(阶段/用户类型/Action/产品)
- 风险等级标注
- 版本管理与回滚
提示词实体示例:
| 字段 | 类型 | 说明 |
|---|---|---|
| prompt_id | string | 唯一标识 |
| content | text | Prompt 内容 |
| version | int/string | 版本号 |
| phase | enum | 会话阶段:Awareness / Consideration / Objection / Purchase |
| user_type | enum | 用户类型:普通 / VIP / 高客单 |
| action | enum | 当前 Action:CTA / 售后 / 退货等 |
| product | string | 产品或品类 |
| gray_ratio | float | 灰度比例(0~1) |
| risk_level | enum | 风险等级:低 / 中 / 高 |
| status | enum | 生效 / 停用 / 回滚 |
2️⃣ Python 代码加载逻辑
在系统运行时,Python 代码做三件事:
-
拉取符合条件的 Prompt
prompt_candidates = db.query(Prompt).filter( phase=current_phase, user_type=current_user_type, action=current_action, product=current_product, status="active" ) -
根据灰度比例选择版本
import random for prompt in prompt_candidates: if random.random() < prompt.gray_ratio: selected_prompt = prompt break else: selected_prompt = old_prompt_version -
调用 LLM 生成回答
- 使用
selected_prompt.content生成回答 - 同时可以记录日志,用于灰度效果监控与风险分析
- 使用
3️⃣ 回滚 & 灰度扩展
-
灰度扩展:
- 调整
gray_ratio从 10% → 30% → 100%
- 调整
-
回滚:
- 设置旧版本 Prompt
status="active" - 新版本 Prompt
status="inactive"或gray_ratio=0
- 设置旧版本 Prompt
-
无需修改代码,可热更新
二、面试可说版本
工业级智能客服的提示词管理:
- 存储:Prompt 放在数据库/配置中心,而非写死在代码里
- 管理:后台支持新建、版本管理、灰度设置、生效范围配置和风险等级标注
- 运行时调用:Python 代码根据用户阶段、Action、用户类型、产品等匹配生效范围,并按灰度比例选择版本生成回答
- 回滚/灰度扩展:通过修改配置即可,无需重启或修改代码
Action降级策略
一、核心结论
Action(客服动作/功能)在系统里必须分级管理,
不同类型的 Action 对业务影响不同,因此降级策略也不同。
换句话说:
- 轻度影响 → 可以关闭、可以临时下线
- 高风险 / 必须服务 → 不允许关闭,只能通过兜底或人工接替
二、Action 分级示例
| 等级 | 描述 | 示例 | 降级策略 |
|---|---|---|---|
| 高风险 / 核心业务 | 关闭会直接影响用户核心业务或法律义务 | 退货处理、退款申请、合同确认 | 不允许直接关闭;可转人工接替 |
| 中风险 / 关键流程辅助 | 对业务有一定影响,但可接受临时中断 | CTA 推送(促销提醒)、交叉销售建议 | 可关闭或降级;可暂时取消推送或降低覆盖率 |
| 低风险 / 次要互动 | 不影响成交或业务安全 | 打招呼、闲聊、轻度推荐 | 可以随意关闭,甚至实验性改动 |
三、工业实践:降级策略设计原则
- 根据 Action 类型分配降级策略
- 高风险 → 禁止关闭;仅能转人工或手工处理
- 中风险 → 可关闭或灰度;可能降低覆盖率或临时禁用
- 低风险 → 完全可关闭;随时调整
- 降级策略可以是多层组合
- 关闭:直接禁用该 action
- 降低覆盖:减少触发概率或场景
- 转人工:在允许的情况下,将 action 转给人工处理
- 灰度 / 限流:仅对部分用户或场景触发
工业里每个 action 都有 类型 + 风险等级 + 推荐降级方式,形成策略表,避免随意操作。

浙公网安备 33010602011771号