Kuberski - 酷伯司机

写在代码边上
  博客园  :: 首页  :: 联系 :: 订阅 订阅  :: 管理

FeedzShare 个性化阅读

Posted on 2009-02-24 17:58  kuber  阅读(1820)  评论(5编辑  收藏  举报
玩聚SR , readerburnerFeedzShare 这样的社会化推荐工具通过聚合读者在社会化媒体上推荐或分享的东西, 帮助我们发现高质量的信息. 读者的推荐保证了文章质量; 根据推荐数过滤, 能快速发现互联网热点.

但对于解决信息过载问题来说, 这种自动聚合只是第一步.
一方面, 随着聚合源的增多, 聚合的文章也急剧增加. 这时往往需要再筛选出价值最高的信息. 然而根据"推荐数人数"过滤得到的结果是大众化的,  只能反映主流(mainstream)的兴趣;
另一面, 它们背后的基本思想和Digg一样: 推荐的人越多,就越有价值, 这使相对比较小众的兴趣由于推荐人少, 难以在首页被显示. 因此"信息过载"和"信息不足"会同时出现;


目标

FeedzShare "个性化阅读"是解决这个问题的一个尝试, 我的目标是:
1. 尽可能过滤掉热门文章中我不会感兴趣的, 节约我的筛选时间;
2. 从一些推荐数比较少的文章中, 找到我可能感兴趣的, 推荐给我;
3. 希望最后呈现给我的文章中75%以上是我希望读到的;


实现

FeedzShare "个性化阅读"采用的是user-based 协同过滤算法. 简单来说, 就是根据用户的喜好计算出与其他用户的相似性, 找到N个最相似的用户, 通常叫做"最近邻". 然后根据最近邻产生预测结果. 关于user-based 协同过滤算法, 可以看看Beyond Search 的介绍.

协 同过滤算法需要先收集一组用户的兴趣数据, 兴趣数据可以是购买记录(Amazon), 打分(rating, 如豆瓣). 而google reader 用户在阅读器中的推荐天然就是很好的输入. FeedzShare 具体做法是, 先找到推荐和我交集的所有用户, 用一定的算法计算出相似程度, 排序后取 top N个用户, 看作我的相近邻. 然后筛选出取出最近被我的相近邻推荐过又没有被我推荐的文章, 做为预测结果推荐给我. 我自己和几个朋友测试了几个月, 现在的算法基本能到达目标.

开始
访问FeedzShare 个性化阅读, 输入你的Google Reader分享页面或RSS地址, FeedzShare 会先分析你的阅读兴趣, 自动跳转到你的个性化阅读主页; 请订阅RSS或者收藏主页地址.


反馈
关于如何通过工具解决信息过载和个性化阅读的话题, 希望能听到你的讨论.
如果你用了FeedzShare 个性化阅读, 我也非常想听到你的反馈. 我用Google Spreadsheet 做了一个小调查, 希望你能告诉我使用"个性化阅读"的效果, 我会根据你的意见继续改进. 

kuber @FeedzShare