2014年4月28日
摘要: 数据输入格式测试数据每个数据和数据之间用空格分开,数据都是double型的Kmean算法在每次取数据时对所有的数据只取其中的一列kmeans命令使用:mahout kmeans \-i \输入目录-c \输入的簇目录-o \输出目录-k \-dm \路径方法的类名,默认是SquaredEu... 阅读全文
posted @ 2014-04-28 14:06 老梁 阅读(1104) 评论(0) 推荐(0)
摘要: 首先简单说明下,mahout下处理的文件必须是SequenceFile格式的,所以需要把txtfile转换成sequenceFile。SequenceFile是hadoop中的一个类,允许我们向文件中写入二进制的键值对,具体介绍请看eyjian写的http://www.hadoopor.com/... 阅读全文
posted @ 2014-04-28 14:04 老梁 阅读(1015) 评论(0) 推荐(0)