隐性特征标签提取
明白,我给你整理一个完整的“历史聊天去噪 → 信任特征提取 → 成交概率训练”流程图的描述,方便直接做 PPT 或交给工程实现。
历史聊天训练流程图(文字版可直接画图)
[历史聊天消息]
│
▼
[去噪处理]
- 丢弃闲聊/问候/系统消息
- 保留用户主动询盘/行为相关消息
- 滑动窗口截取最近 N 会话或天数
- 文本标准化(小写、符号、单位统一)
│
▼
[消息特征提取]
- 显性行为特征:问价、对比、加购、checkout
- 隐性意向特征:
• 咨询深度
• 意向演进趋势
• 决策投入度
• 信任构建程度(Trust Signals)
• 决策阻力结构
• 互动稳定性
│
▼
[会话级 / 用户级聚合]
- 窗口加权(最近消息权重更高)
- 时间衰减(老消息影响下降)
- 输出用户级信任特征和行为特征
│
▼
[标签对齐]
- 成交概率标签:48h 内是否下单
- 复购潜力 / 客单价标签
│
▼
[模型训练]
- MiniLM / DistilBERT 分类器(信任、意向识别)
- LightGBM 或 Logistic Regression(成交概率预测)
│
▼
[输出]
- 用户级信任分 / Trust Signals
- 成交概率(0~1)
- 用于 Agent 实时策略 & 推送决策
工程关键点说明
-
去噪:先处理数据,保证训练样本质量
-
消息级特征 + 用户级聚合:同时保留即时和历史信息
-
信任特征:逐条识别 → 聚合 → 输出数值化特征
-
标签对齐:训练模型前必须和成交行为严格对应
-
模型输出:
- 实时 Agent 使用增量更新特征
- 历史批量训练更新用户画像与成交概率

浙公网安备 33010602011771号