《OD大数据实战》Mahout入门实例
一、环境搭建
1. 下载
2. 解压
3.
mahout org.apache.mahout.clustering.syntheticcontrol.kmeans.Job
hdfs dfs -ls /output
转换成普通文本
hdfs dfs -ls /output/clusteredPoints
mahout seqdumper -i output/clusteredPoints -o dataset/clusteredPoints
cat clusteredPoints | more
cat clusteredPoints | awk `{print $2}` | sort | uniq
mahout vectordump -i output/data -o dataset/raw_data
![]() |
作者:沙漏哟 出处:计算机的未来在于连接 本文版权归作者和博客园共有,欢迎转载,请留下原文链接 微信随缘扩列,聊创业聊产品,偶尔搞搞技术 |


浙公网安备 33010602011771号