快手用户活跃度预测

任务目标

预测用户未来7天的活跃度(出现任意行为)
难点:不等长序列

数据分析

注册表,登陆表,创建表,行为表截屏2024-05-06 00.06.18.png截屏2024-05-06 00.08.23.png截屏2024-05-06 00.08.55.png
image.png截屏2024-05-06 00.09.55.png截屏2024-05-06 00.10.27.png截屏2024-05-06 00.10.42.png截屏2024-05-06 00.11.17.png截屏2024-05-06 00.11.42.png

模型架构

RNN结构

构建用户特征序列

截屏2024-05-06 00.12.52.png
保证每个batch内序列长度一样,将序列长度一样的id进行分类
截屏2024-05-06 00.14.20.png截屏2024-05-06 00.16.54.png截屏2024-05-06 00.19.29.png截屏2024-05-06 00.21.21.png

序列特征提取方法截屏2024-05-06 00.23.01.png截屏2024-05-06 00.24.56.png截屏2024-05-06 00.28.38.png截屏2024-05-06 00.30.03.png

生成特征汇总表

截屏2024-05-06 00.34.01.png截屏2024-05-06 00.35.21.png截屏2024-05-06 00.36.13.png截屏2024-05-06 00.37.03.png截屏2024-05-06 00.37.26.png

标签制作截屏2024-05-06 00.40.27.png截屏2024-05-06 00.41.54.png截屏2024-05-06 00.45.08.png

网络训练模块

使用动态RNN,将最后一步复制自动填充
截屏2024-05-06 00.46.14.png
由于大部分后半段无标签,选择部分结果与标签计算训练损失截屏2024-05-06 00.49.56.png
选择常见的几种 序列长度进行训练截屏2024-05-06 00.52.43.png 截屏2024-05-06 00.55.52.png

模型结果截屏2024-05-06 01.01.46.png截屏2024-05-06 01.01.19.png截屏2024-05-06 01.00.17.png截屏2024-05-06 01.02.04.png截屏2024-05-06 01.00.52.png

posted @ 2024-05-06 01:07  一个空指针  阅读(185)  评论(0)    收藏  举报