推荐系统实践(项亮)— 第5章 利用上下文信息
准确了解用户的上下文信息(包括时间、地点、心情等),对于提升推荐效果有重要作用。
5.1 时间上下文信息
(1)时间效应
- 用户的兴趣是变化的
- 物品也有生命周期
- 季节效应
(2)系统时间特性的分析
- 数据集每天独立用户数的增长情况
- 系统物品的变化情况
- e.g. 物品平均在线天数
- e.g. 相隔T天系统物品流行度向量的平均相似度
- 用户访问情况,统计用户平均活跃天数,或者统计相隔T天来统计用户的重合度。
(3)推荐系统的实时性
- 推荐算法需要平衡考虑用户的近期行为和长期行为(即要让推荐列表反应出用户近期行为所体现的兴趣变化,又不能让推荐列表完全受用户近期行为的影响);
- 在用户访问推荐系统时,根据用户这个时间点前的行为,实时计算推荐列表;
(4)推荐算法的时间多样性
推荐系统每天推荐结果的变化程度被定义为推荐系统的时间多样性。时间多样性高的推荐系统中用户会经常看到不同的推荐结果(首先保证推荐的精度,在此基础上适当地考虑时间多样性)
(5)时间上下文相关的ItemCF算法
ItemCF由两部分构成:计算物品间的相似性,利用用户历史行为和物品相似性给用户推荐商品,加入时间上下文信息后,可以对这两部分做出改进。
(6)时间上下文相关的UserCF算法
UserCF算法的基本:给用户推荐和他兴趣相似的其他用户喜欢的物品。
与时间上下文的ITemCF算法类似,UserCF算法需要改进的也有两方面:用户相似性度量的计算改进和相似用户对物品兴趣计算的改进。
5.2 地点上下文信息