文章分类 -  mahout

摘要:.mahout 决策树算法实验 http://blog.sina.com.cn/s/blog_61c463090100pbdh.html导入到hdfsbin/hadoop fs -put ./KDDTrain+.arff /user/root/bin/hadoop fs -put ./KDDTest+.arff /user/root/生成格式数据bin/hadoop jar mahout-0.4.jar org.apache.mahout.df.tools.Describe -p "/user/root/KDDTrain+.arff" -f /user/root/KDDTr 阅读全文
posted @ 2012-11-27 14:17 王文璞 阅读(186) 评论(0) 推荐(0)
摘要:Mahout中相似度计算方法介绍http://blog.csdn.net/samxx8/article/details/7691868Mahout中相似度计算方法介绍 在现实中广泛使用的推荐系统一般都是基于协同过滤算法的,这类算法通常都需要计算用户与用户或者项目与项目之间的相似度,对于数据量以及数据类型不同的数 据源,需要不同的相似度计算方法来提高推荐性能,在mahout提供了大量用于计算相似度的组件,这些组件分别实现了不同的相似度计算方法。下图用于实现 相似度计算的组件之间的关系:图1、项目相似度计算组件图2、用户相似度计算组件下面就几个重点相似度计算方法做介绍:皮尔森相关度类名:Pears 阅读全文
posted @ 2012-11-02 16:30 王文璞 阅读(104) 评论(0) 推荐(0)