摘要:分析数据有哪些数据选用什么样的推荐算法Finding an effective recommender各种算法组合测试Tanimoto算法在与thresholdneighborhoold结合时值应该设置比较底,0.5已经是很高的相似度可以重写ItemSimilarity ,把自己的功能放到里面IDR...
阅读全文
摘要:转自http://blog.sina.com.cn/s/blog_6f7265cf0101nbfm.html推荐系统随处可见,比如推荐歌词、推荐广告、推荐文章,这里谈到的是基于内容的推荐系统。基于内容的推荐(Content-based Recommendations),根据用户过去喜欢的产品,为用户...
阅读全文
摘要:转自http://blog.csdn.net/ymkrdfewxf/article/details/8028343来自于:http://blog.sina.com.cn/s/blog_602feaa80100fjq9.html在推荐系统简介中,我们给出了推荐系统的一般框架。很明显,推荐方法是整个推荐...
阅读全文
摘要:http://baike.baidu.com/view/2886013.htm项的集合称为项集。包含k个项的项集称为k-项集。集合{computer,ativirus_software}是一个二项集。项集的出项频率是包含项集的事务数,简称为项集的频率,支持度计数或计数。注意,定义项集的支持度有时称为...
阅读全文
摘要:转自 http://www.open-open.com/lib/view/open1383390452040.html在Mahout实现的机器学习算法见下表算法类算法名中文名分类算法Logistic Regression逻辑回归Bayesian贝叶斯SVM支持向量机Perceptron感知器算法Ne...
阅读全文
摘要:Understanding user-based recommendation1.When recommendation goes wrong选择合适的data set作为训练数据2.When recommendation goes rightExploring the user-based rec...
阅读全文
摘要:Representing preference data1.Thre Preference ObjectOne object represents one user’s preference for one item.Preference is an interface, and the imple...
阅读全文
摘要:转自http://www.douban.com/note/208193209/User CF 和 Item CF 都依赖于相似度的计算,因为只有通过衡量用户之间或物品之间的相似度,才能找到用户的“邻居”,才能完成推荐。上文简单的介绍了相似度的计算,但不完全,下面就对常用的相似度计算方法进行详细的介绍...
阅读全文
摘要:转自http://www.douban.com/note/205498112/协同过滤 —— Collaborative Filtering协同过滤简单来说就是根据目标用户的行为特征,为他发现一个兴趣相投、拥有共同经验的群体,然后根据群体的喜好来为目标用户过滤可能感兴趣的内容。协同过滤推荐 —— C...
阅读全文
摘要:转自http://www.douban.com/note/204399134/推荐数据的处理是大规模的,在集群环境下一次要处理的数据可能是数GB,所以Mahout针对推荐数据进行了优化。Preference在Mahout中,用户的喜好被抽象为一个Preference,包含了userId,itemId...
阅读全文
摘要:http://blog.csdn.net/zhoubl668/article/details/13297663http://www.cnblogs.com/dlts26/archive/2012/06/20/2555772.htmlhttps://mahout.apache.org/users/re...
阅读全文
摘要:mahout overviewCurrently Mahout supports mainly three use cases: Recommendation mining takes users' behavior and from that tries to find items users m...
阅读全文