随笔分类 - 推荐系统
《推荐系统实践(项亮)》读书笔记
摘要:本文内容基于An introductory tutoril onkd-trees1.KDTree介绍KDTree根据m维空间中的数据集D构建的二叉树,能加快常用于最近邻查找(在加快k-means算法中有应用)。其节点具有如下属性(对应第5节中的程序实现):非叶子节点(不存储数据):partition...
阅读全文
摘要:场景:一个新妈妈给刚出生的宝宝买用品,随着宝宝的长大,不同的阶段需要不同的物品。这个场景中涉及到考虑用户所处阶段,给用户推荐物品的问题。如果使用用户协同过滤,则需要根据购买记录,找到与用户处于同一阶段的用户。不加入分类信息,单纯使用物品信息,则可能因为买了不同牌子的尿布,而判断为非相似用户,所以加入...
阅读全文
摘要:代码:用户标签通过标签将用户和物品联系起来标签的作用:1.物品相关:物品的属性(时间,创作者等)2.用户相关:用户对物品的看法、任务(待读等)算法:1.简单算法(推荐用户常用标签下的热门物品) 计算用户对物品的喜好 $p(u,i)=\sum_b \frac{n_{u,b}}{log(1+n_b^{(...
阅读全文
摘要:注意:$\alpha$和$\beta$已知,常用为(和LDA EM算法不同)1. 为什么可用LDA模型求解的目标为得到$\phi$和$\theta$假设现在已知每个单词对应的主题$z$,则可以求得$\theta$的后验分布,求期望得到$E(\theta)$作为每份文档的主题$E(\theta_{mk...
阅读全文
摘要:1.LDA介绍LDA假设生成一份文档的步骤如下:模型表示:单词w:词典的长度为v,则单词为长度为v的,只有一个分量是1,其他分量为0的向量 $(0,0,...,0,1,0,...,0,0)$文档W: 单词的组合,$(w_1,w_2,...,w_N)$,可以看成是 $v*N$ (词典长度*单词个...
阅读全文
摘要:# coding=gbk'''选择用户反馈的物品将评分>3定义为喜欢'''import pandas as pdimport numpy as npimport copy#获取区分度def getDiff(userRates,movie): like=dict() dislike=dic...
阅读全文
摘要:代码1:# coding=gbk'''数据集:BX-Users.csv,包含用户的ID、位置和年龄。BX-Books.csv,包含图书的ISBN、标题、作者、发表年代、出版社和缩略。BX-Book-Ratings.csv, 包含用户对图书的评分信息。比较两种p(f,i)两种定义方式,给[年龄50]两...
阅读全文
摘要:定义:在开始阶段,没有大量用户数据的情况下,进行个性化推荐的问题。分类对策(提供非个性化推荐-热门推荐)用户冷启动-对新用户进行推荐A1.利用新用户的注册信息进行推荐 2.导入用户社交网站信息A3.要求用户对一些物品进行反馈物品冷启动-将新物品推荐给用户B1.利用物品的内容信息进行推荐系统冷启动-在...
阅读全文
摘要:算法思想:1.将用户对物品的反馈记录,转换为2分图2.使用随机游走算法,计算从用户节点u到物品节点i的概率,作为用户对物品的喜好(2分图)例子:数据集2分图AaAbBaBcCb(随机游走)分析:比如从A点出发,每一步,有$\alpha$的概率继续往下走,$1-\alpha$的概率返回A如果将所在位置...
阅读全文
摘要:隐语义模型:物品 表示为长度为k的向量q(每个分量都表示 物品具有某个特征的程度)用户兴趣 表示为长度为k的向量p(每个分量都表示 用户对某个特征的喜好程度)用户u对物品i的兴趣可以表示为 其损失函数定义为- 使用随机梯度下降,获得参数p,q负样本生成:对于只有正反馈信息(用户收藏了,关注了...
阅读全文
摘要:算法步骤:1.计算物品相似度2.根据用户购买记录,推荐相似物品物品相似度定义:A. 购买i的人里面,有多少比例购买了j 缺点(推荐系统需要能挖掘长尾信息,此处若j很热门,则w趋向于很大,则买了i的人都会被推荐j,热门商品更加热门)B. 在A的基础上,加入了对热门物品j的惩罚C. 活跃用户的贡献度应该...
阅读全文
摘要:好的推荐系统:三赢 用户-找到自己感兴趣的东西 商家-增加了销量 网站-得到好的发聩,提升了推荐质量;提高了收入推荐系统评测方法:优点缺点1.离线实验只需要数据集,不需要用户参与,不需要实际系统;速度快,可测试大量算法;无法计算商业上关心的指标,如点击率、转化率等2.调查问卷可获得用户主管感受...
阅读全文
摘要:---恢复内容开始---算法步骤:1.计算用户相似度2.对于特定用户,选出k个最相似的用户,将这些用户评价过的前k好的物品推荐给该用户用户相似度 度量:其中|N(u)|表示用户u评价过的物品的数量,|N(i)|为物品i的流行度,即物品i被多少用户评价过这里物品流行度越高,它在相似度的度量上作用越小(...
阅读全文

浙公网安备 33010602011771号