销售机器人信息提取
目录
- 一、核心目标回顾
- 二、信息提取总表(14 大类)
- 1. 购买意图强度(Purchase Intent Level)
- 2. 购买时间窗口(Purchase Time Window)
- 3. 用户预算(Price Range / Budget)
- 4. 用户偏好的规格(Product Specifications Preference)
- 5. 功能需求(Use Case / Job-to-be-Done)
- 6. 用户的痛点(Pain Points)
- 7. 购买阻碍与疑虑(Objections)
- 8. 竞争品与对比对象(Competitor / Comparison Items)
- 9. 用户对服务的偏好(Service Preferences)
- 10. 语言与沟通风格(Communication Style)
- 11. 用户的历史互动轨迹(Behavior History Signals)
- 12. 交易概率(Conversion Probability)
- 13. 用户所在地与物流条件(Region & Logistics Constraints)
- 14. 用户画像维度(User Profile Schema)
- 三、给你一个最实际的模板(可直接给工程/算法使用)
- 四、你真正应该问自己的问题(PM 视角)
- 会话内提取的核心作用
以下内容面向产品经理视角,按照跨境电商导购/客服智能体的最佳实践提供可落地的“信息提取清单(User Insights Extraction Schema)”,并包含每项的作用、使用场景,以及是否建议长期保存(用户画像)或短期使用(会话策略)。
一、核心目标回顾
你要做到两件事:
- 实时理解用户偏向 → 优化当前推荐策略(在会话内转化)
- 长期沉淀用户画像 → 在未来几天重新触达、个性化推荐(会话外转化)
所以需要区分:
- 即时行为特征(Session Intent Signals)
- 长期稳定特征(User Profile Traits)
- 决策偏好(Preference Signals)
二、信息提取总表(14 大类)
以下是跨境电商导购智能体中最关键、最常用、也最能提升 GMV 的信息维度。
1. 购买意图强度(Purchase Intent Level)
提取内容:
- 是否明确想购买
- 当前是否在比较
- 仅仅是浏览、闲聊
使用:
- 在会话内判断是否要 aggressive 推品、上优惠、或转轻聊
- 作为 S2 触达(次日提醒)的强信号
2. 购买时间窗口(Purchase Time Window)
提取内容:
- 立即买
- 今天
- 本周
- 近期没打算,但可能将来考虑
使用:
- 决定后续的跟进节点(隔天推荐、满减提醒、到货提醒)
3. 用户预算(Price Range / Budget)
提取内容:
- 明确预算(200 美金以内)
- 隐性预算(“有点贵”,“能便宜点吗”)
使用:
- 实时过滤推荐
- 下次触达推降价/折扣品
4. 用户偏好的规格(Product Specifications Preference)
跨境电商最重要的信息之一。
提取内容举例:
- 手机:屏幕大小、电池、拍照能力、品牌倾向
- 美妆:肤质、色号偏好、品牌忠诚度
- 家电:容量、能耗、噪音、是否智能
- 服饰:尺码、颜色、风格(简约/街潮/成熟)
使用:
- 建立长期偏好画像
- 下次触达时自动补品或者推同类爆品
5. 功能需求(Use Case / Job-to-be-Done)
提取内容:
- 买手机给老人
- 买耳机用于运动
- 买玩具给小孩
- 买护肤品为解决具体问题(痘痘、敏感等)
使用:
- 根据需求推品
- 用户画像沉淀“需求场景标签”
6. 用户的痛点(Pain Points)
提取内容:
- “之前买的容易坏”
- “之前运费太贵”
- “不想等太久”
使用:
- 对症推荐
- 下次触达时利用痛点回溯(“这个型号物流更快”)
7. 购买阻碍与疑虑(Objections)
提取内容:
- 价格
- 品牌信任度
- 品质
- 是否兼容
- 是否真实商品
使用:
- 会话内处理异议
- 会话外在次日用“消除异议内容”二次触达
8. 竞争品与对比对象(Competitor / Comparison Items)
提取内容:
- 用户看过的型号或品牌
- 在比较 A vs B
- 曾在其他平台看到过(亚马逊、速卖通等)
使用:
- 自动生成对比表
- 后续 push 价格变动、替代型号
9. 用户对服务的偏好(Service Preferences)
提取内容:
- 期望物流速度
- 是否要求免税
- 是否优先看退货政策
- 是否要求客服答得快
使用:
- 会话内调服务文案
- 下次触达时强调“无忧退换/包邮”等卖点
10. 语言与沟通风格(Communication Style)
提取内容:
- 长文本 / 短文本
- 喜欢英文/中文
- 喜欢图片/视频
- 对专业术语的接受度
使用:
- 会话用词调整
- 个性化触达方式(视频推荐 vs 文本推荐)
11. 用户的历史互动轨迹(Behavior History Signals)
提取内容:
- 看过的商品
- 加购
- 收藏
- 聊天中点开过的商品卡片
使用:
- 预测下一次可能购买的品类
- 下次触达推加购优惠
12. 交易概率(Conversion Probability)
系统可由模型给出评分。
提取内容:
- 高价值客户
- 中度犹豫
- 无意向
使用:
- 决定是否 push 优惠券
- 后续触达是否继续花精力跟进
13. 用户所在地与物流条件(Region & Logistics Constraints)
提取内容:
- 国家/城市
- 收货限制(如某些国家不支持特定电池产品)
使用:
- 过滤不适配商品
- 触达时推“本地仓 + 免税”商品
14. 用户画像维度(User Profile Schema)
提取建议维度:
- 性别(推断)
- 年龄段(推断)
- 生活方式标签(宠物、健身、学生、白领等)
- 兴趣偏好(科技、美妆、手工、汽车)
- 价格敏感度(敏感 / 适中 / 不敏感)
- 品质敏感度
- 对品牌的忠诚度
使用:
- 长期推荐
- 个性化 feed 流(如果你们有 APP/小程序)
三、给你一个最实际的模板(可直接给工程/算法使用)
{
"session_intent": "compare / buy / browse / no_intent",
"purchase_intent_level": "high | medium | low",
"buy_time_window": "now | today | this_week | unknown",
"budget": "number or range",
"must_have_specs": [...],
"nice_to_have_specs": [...],
"use_cases": [...],
"pain_points": [...],
"objections": [...],
"competitor_items": [...],
"service_preferences": {
"shipping_speed": "fast / cheap",
"refund_policy": "strict / flexible",
"authenticity": true
},
"communication_style": "brief / detailed / img_preferred / video_preferred",
"logistics_region": "...",
"behaviors": {
"viewed_items": [...],
"clicked_items": [...],
"added_to_cart": [...],
"requested_comparison": [...]
},
"conversion_probability": 0.0 ~ 1.0,
"user_profile_tags": [
"tech_lover",
"price_sensitive",
"gift_for_children",
...
]
}
四、你真正应该问自己的问题(PM 视角)
你需要决定:
- 哪些信息需要实时推理(Online NLU)
- 哪些需要沉淀入 User Profile(Long-term Memory)
- 哪些只在会话内用完即弃(Session-level)
会话内提取的核心作用
会话内的提取主要是针对当前对话的即时决策,但它同时可以部分更新用户画像,关键在于你如何设计数据流和存储策略。可以分清楚几个层次:
1. 会话内提取的核心作用
| 作用 | 说明 |
|---|---|
| 驱动工具调用 | 根据用户意图调用对应工具,例如:产品搜索、优惠券查询、物流查询。比如用户说“我想买iPhone”,会话内提取品牌、型号、价格槽位后触发产品搜索工具。 |
| 辅助意图识别 | 细化意图类别,例如用户说“想买一个礼物给妈妈”,提取recipient=mother可以帮助意图分类更准确。 |
| 决策策略 | Agent的下一步动作,如确认槽位、推荐、引导购买。会话内特征直接作为策略输入。 |
2. 会话内提取能否构建用户画像?
可以,但一般是部分、临时的画像:
-
会话内提取的数据可做增量更新:
- 当前偏好:品牌、价格区间、产品类别
- 当前需求:功能、用途
- 潜在意图:购买强度、时间窗口
-
这些数据可以实时写入用户画像缓存(如Redis或短期数据库),支持跨轮对话的连续性。
-
对于长期用户画像(跨天、跨周),通常需要离线沉淀,例如历史偏好统计、累积购买行为等。
3. 总结关系
实时提取(会话内)
├─ 核心目标:驱动工具、判断意图、策略决策。 存储在redis缓存即可
└─ 增量画像:记录当前偏好或临时槽位,可支持会话连续性
离线提取(会话外)
├─ 核心目标:长期画像、用户偏好沉淀、个性化推荐
└─ 数据来源:会话内提取 + 历史行为 + 交易记录
原则:
- 会话内 = “即时行为特征 + 临时槽位”,主要用于对话流和推荐决策
- 会话外 = “长期稳定偏好 + 决策偏好”,用于画像、再营销和跨会话推荐

浙公网安备 33010602011771号