Improving Item Cold-start Recommendation via Model-agnostic Conditional Variational Autoencoder阅读笔记

动机

本文是2022年SIGIR上的一篇论文。解决推荐系统中冷启动问题通常有两种方法：1.挖掘历史数据中的分布模式，例如学习一个辅助信息到id的映射。2.在交互物品有限的情况下提高学习效率，例如元学习。但是很少有方法同时兼顾这两个方向，本文提出了CVAR模型解决了上述问题该文主要解决的是item的冷启动问题，在CTR预估场景下。

方法

以下是CVAR的框架。

首先我们有物品id嵌入表示，物品的所有特征表示和部分特征表示，分别用\(v_i、v_{\mathcal I}、v_{\mathcal X}\)表示。在正常情况下，我们用物品的id表示和所有特征表示即可计算出点击物品的可能性

损失函数为

因为部分物品只有很少交互，所以它们的id表示是不准确的。本文采用了一个编码器-解码器结构，将物品的id表示降维，去除id表示的噪声，然后将辅助信息也降维，与id表示对齐。之后再通过解码器根据分布得到具体的表示，id的新的表示为

辅助信息的新的表示为

\(\mathcal L_w\)表示id的分布和辅助信息分布要相似。

原本id的表示和生成的id表示也要相似。
之后使用生成的id表示进行预测

最终的损失为