Recurrent Meta-Learning against Generalized Cold-Start Problem in CTR Prediction阅读笔记

动机

本文是ACM MM2022上的一篇论文。在冷启动问题中,之前的工作大多数只考虑到新用户和新广告,并且用户的兴趣也可能随着时间去改变。因此,本文作者认为冷启动问题在时间维度上也存在,提出了广义的冷启动,并且提出了解决广义上的冷启动问题的方法。

方法

本文对冷启动的定义将一个会话序列(短的交互序列)定义为一个任务,而不是像往常一样将一个用户当作一个任务。每个用户可以将自己的交互序列切分为多个会话序列,每个会话序列最后一个物品当作预测目标的物品。
本方法框架如下

首先将用户、序列、目标输入进embedding层以获得embedding表示,

然后通过attention层根据目标和序列物品计算出权重,加权获得序列表示,

再通过lstm层获取序列的另一种表示,

lstm层可以提取用户的兴趣转移,attention可以捕获序列和目标物品的相关性,两者搭配使用可以减少噪声影响。
将上述表示连接起来,然后输入进MLP获取最终预测


预测损失为

辅助损失为

所有的损失为

训练方法采用MAML。

实验结果

本论文提出的方法超越所有的baseline。

总结

本文是会话推荐冷启动,和之前冷启动问题的定义不同,主要是利用了lstm和transformer捕获了更多的序列信息,再加上元学习,可以让包含新用户和新物品的会话序列快速适应推荐系统。

posted @ 2022-10-24 17:32  South1999  阅读(68)  评论(0编辑  收藏  举报