推荐系统领域的深度学习发展综述
Paper Reading 内容
知乎讲解
问题
| 页码 |
问题内容 |
| P46 |
为什么L1范数比L2范数更容易产生稀疏解 |
前深度学习时代
P48
| 模型名称 |
基本原理&Tips |
特点 |
局限性 |
| 协同过滤(Collaborative, CF) |
协同大家的反馈、评价和意见(共现矩阵)一起对海量的信息进行过滤,focus相似度 |
非常直观 |
但泛化性很差,无法将两个物品相似这一信息用于计算—新商品的向量非常稀疏,推荐结果的头部效应很明显 |
| 用户协同过滤 UserCF |
|
具有较强的社交特性,适合发现热点,跟踪热点的趋势————适合新闻推荐场景 |
互联网应用下用户数远远大于物品数,用户的历史数据向量往往非常稀疏 |
| 物品协同过滤 ItemCF |
|
适用于兴趣变化较为稳定的应用,比如电商,视频推荐场景 |
|
| 改进算法—矩阵分解 |
为每个用户和视频生成一个隐向量,在空间上相近的用户和视频即为类似视频。计算方法:特征值分解(只能方阵),奇异值分解(要求稠密,计算量大),梯度下降 |
提高了稀疏矩阵的处理能力,泛化能力强,空间复杂低,扩展性 |
难以利用其他用户、物品特征以及上下文信息 |
| 逻辑回归 |
点击率(Click Through Rate, CTR)预估问题,focus分类问题,预测正样本的概率 |
|
表达能力不强,无法特征交叉,特征筛选等一系列高级操作,不可避免的造成信息损失。 |
| 因子分解机(Factorization Machine, FM) |
|
|
|
| 域感知因子分解机(Field-aware Factorization Machine, FFM) |
|
|
|
|
|
|
|
|
|
|
|