rabby

集体智慧编程-making recommendations

1 通过 Euclidean distance 和 Pearson correlation.寻找用户得“相似度”,Euclidean比较好理解,和曼哈顿差不多,而

Pearson 就比较高深了,是按照两组数据所产生得“直线”(correlation)来比较相似度,直线的度数(45度为绝对相似)。

2根据相似度,某物所产生的推荐值也不同(设x是寻找者,y被询问者,y对于x的推荐值是x和y的详细度*y个人的推荐值)

所有的被询问者的平均值就是某物的推荐值,根据推荐值的高低排列

3delicious的例子,相似度的一个特别的用处是,发现同一用户是不是用不同的账号来提高某个网址的关注度。

4User-Based or Item-Based Filtering?

Item-based Filtering 在有很多数据的时候性能上要优于,首先要创建一个item-相似表(可能需要一些时间)。

posted on 2010-09-19 02:31  rabby  阅读(201)  评论(0)    收藏  举报

导航