集体智慧编程－making recommendations

1 通过 Euclidean distance 和 Pearson correlation.寻找用户得“相似度”，Euclidean比较好理解，和曼哈顿差不多，而

Pearson 就比较高深了，是按照两组数据所产生得“直线”（correlation）来比较相似度，直线的度数（45度为绝对相似）。

2根据相似度，某物所产生的推荐值也不同（设x是寻找者，y被询问者，y对于x的推荐值是x和y的详细度＊y个人的推荐值）

所有的被询问者的平均值就是某物的推荐值，根据推荐值的高低排列

3delicious的例子，相似度的一个特别的用处是，发现同一用户是不是用不同的账号来提高某个网址的关注度。

4User-Based or Item-Based Filtering?

Item－based Filtering 在有很多数据的时候性能上要优于，首先要创建一个item－相似表（可能需要一些时间）。

posted on 2010-09-19 02:31 rabby 阅读(201) 评论(0) 收藏举报

刷新页面返回顶部

rabby