摘要:
最近几天测试了mahout svd算法,网上的文档比较少,花了不少时间读它的代码,终于把流程搞清楚了,在这里总结一下。1、关于奇异值分解的理论基础,请参看下面的链接http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html2、关于奇异值分解的应用场景,请参看下面的例子http://www.igvita.com/2007/01/15/svd-recommendation-system-in-ruby/3、关于奇异值分解输入、输出文格式的件的转换,,请参考 http://bickson.blogsp 阅读全文
posted @ 2012-04-26 21:43
icamel
阅读(990)
评论(0)
推荐(0)
摘要:
最近看推荐系统方面的东西也有段日子了,有书,博客,唯独没有看论文。总感觉论文对于工业界来说用处真的不如学校做课题、论文那么大,只要知道某个算法好不好用以及怎么用就可以了,也不必知道太多的细节和数学推导。但根据一个好的算法,产品部门可以设计出很多很酷的产品,让用户倍感web应用的人性化。在看书,看大牛们的博客时,学习到了很多算法和思路。现在总结一下:1、Item based collective filtering这个算法是cf中的一种,也是当今很多大型网站都在采用的核心算法之一。对于商城网站(以Amazon为代表,当然也包括京东那种具有搞笑特色的推荐系统在内),影视类推荐,图书类推荐,音乐类推 阅读全文
posted @ 2012-04-26 21:02
icamel
阅读(1209)
评论(0)
推荐(1)
摘要:
我总结了一下现有的著名的商业推荐系统,这里也分享一下:图书Amazon豆瓣读书当当网新闻google newsGenieo电影NetflixJinniMovieLensRotten TomatoesFlixsterMTime音乐豆瓣电台LastfmPandoraMufinLalaEMusicPing视频YoutubeHuluClciker文章CiteULikeGoogle ReaderStumbleUpon旅游WanderflyTripAdvisor社会网络Facebooktwitter综合AmazonGetGlueStrands欢迎大家补充,我还在不断完善这个列表本文转载在:http://b 阅读全文
posted @ 2012-04-26 20:38
icamel
阅读(386)
评论(0)
推荐(0)
摘要:
KDD Cup 2011的主题是音乐推荐,虽然数据集还没有正式公布,但相关的讨论已经开始预热了。本次数据集合的一个特点,是评分对象不光是歌曲,还包括专辑、艺术家 和音乐流派,这使得用户的偏好相对更丰富和层次化;但content-based的研究者意见很大,音乐信息也被搞成匿名使得他们基本没法玩了。其实个人认为,即使有了用户评分和资源数据,类似这样以特定目标函数为优化对象的竞赛,距离实际应用的音乐推荐系统还有蛮大的差别。毕竟我们没办法拿几个 prediction指标来评价效果,更何况对于一个日常实际应用来讲,在更新相对缓慢的音乐数据集合上想要做的不是一个单次推荐。还是那句正确的废话, 数据、算法 阅读全文
posted @ 2012-04-26 20:36
icamel
阅读(373)
评论(0)
推荐(0)
浙公网安备 33010602011771号