18 【实战】推荐系统依赖的数据源和特征工程

image

  • 业务数据库->模型训练
  • 前端埋点日志->模型预估
  • 外部数据->统计报表输出

image
image

  • 归一化:变换到0-1之间
  • 分箱处理:分为不同阶段
  • one-hot:用于简单词语的分类 0,1分别对应nannv
  • tf-idf:用于关键词对应
  • 行为的id列表:embedding向量化
posted @ 2022-12-19 16:43  Trouvaille_fighting  阅读(94)  评论(0)    收藏  举报