隐性特征标签提取

明白,我给你整理一个完整的“历史聊天去噪 → 信任特征提取 → 成交概率训练”流程图的描述,方便直接做 PPT 或交给工程实现。


历史聊天训练流程图(文字版可直接画图)

[历史聊天消息]
       │
       ▼
[去噪处理]
   - 丢弃闲聊/问候/系统消息
   - 保留用户主动询盘/行为相关消息
   - 滑动窗口截取最近 N 会话或天数
   - 文本标准化(小写、符号、单位统一)
       │
       ▼
[消息特征提取]
   - 显性行为特征:问价、对比、加购、checkout
   - 隐性意向特征:
       • 咨询深度
       • 意向演进趋势
       • 决策投入度
       • 信任构建程度(Trust Signals)
       • 决策阻力结构
       • 互动稳定性
       │
       ▼
[会话级 / 用户级聚合]
   - 窗口加权(最近消息权重更高)
   - 时间衰减(老消息影响下降)
   - 输出用户级信任特征和行为特征
       │
       ▼
[标签对齐]
   - 成交概率标签:48h 内是否下单
   - 复购潜力 / 客单价标签
       │
       ▼
[模型训练]
   - MiniLM / DistilBERT 分类器(信任、意向识别)
   - LightGBM 或 Logistic Regression(成交概率预测)
       │
       ▼
[输出]
   - 用户级信任分 / Trust Signals
   - 成交概率(0~1)
   - 用于 Agent 实时策略 & 推送决策

工程关键点说明

  1. 去噪:先处理数据,保证训练样本质量

  2. 消息级特征 + 用户级聚合:同时保留即时和历史信息

  3. 信任特征:逐条识别 → 聚合 → 输出数值化特征

  4. 标签对齐:训练模型前必须和成交行为严格对应

  5. 模型输出

    • 实时 Agent 使用增量更新特征
    • 历史批量训练更新用户画像与成交概率
posted @ 2025-12-15 15:00  向着朝阳  阅读(31)  评论(0)    收藏  举报