协同过滤
协同过滤可分为基于用户的协同过滤和基于物品的协同过滤
一、基于用户的协同过滤
基于用户的协同过滤算法符合人们对于“趣味相投”的认知,即兴趣相似的用户往往有相同的物品喜好:当目标用户需要个性化推荐时,可以先找到和目标用户有相似兴趣的用户群体,然后将这个用户群体喜欢的、而目标用户没有听说过的物品推荐给目标用户。

基于用户的协同过滤算法的实现主要包括两个步骤:
第一步:找到和目标用户兴趣相似的用户集合
第二步:找到该集合中的用户所喜欢的、且目标用户没有听说过的物品推荐给目标用户
实现基于用户的协同过滤算法的关键步骤是计算用户与用户之间的兴趣相似度。
二、基于物品的协同过滤算法
基于物品的协同过滤算法(简称ItemCF算法)是目前业界应用最多的算法。无论是亚马逊还是Netflix,其推荐系统的基础都是ItemCF算法
基于物品的协同过滤算法是给目标用户推荐那些和他们之前喜欢的物品相似的物品。ItemCF算法主要通过分析用户的行为记录来计算物品之间的相似度
该算法基于的假设是:物品A和物品B具有很大的相似度是因为喜欢物品A的用户大多也喜欢物品B。例如,该算法会因为你购买过《数据挖掘导论》而给你推荐《机器学习实战》,因为买过《数据挖掘导论》的用户多数也购买了《机器学习实战》

ItemCF算法与UserCF算法类似,计算也分为两步:
第一步:计算物品之间的相似度;
第二步:根据物品的相似度和用户的历史行为,给用户生成推荐列表。
三、基于用户的协同过滤算法和基于物品的协同过滤算法的对比
基于用户的协同过滤算法的推荐更偏向社会化:适合应用于新闻推荐、微博话题推荐等应用场景,其推荐结果在新颖性方面有一定的优势
基于用户的协同过滤缺点:随着用户数目的增大,用户相似度计算复杂度越来越高。而且基于用户的协同过滤推荐结果相关性较弱,难以对推荐结果作出解释,容易受大众影响而推荐热门物品
基于物品的协同过滤算法的推荐更偏向于个性化:适合应用于电子商务、电影、图书等应用场景,可以利用用户的历史行为给推荐结果作出解释,让用户更为信服推荐的效果
基于物品的协同过滤缺点:倾向于推荐与用户已购买商品相似的商品,往往会出现重复推荐、多样性不足、推荐新颖度较低的问题
浙公网安备 33010602011771号