基于命令行的mahout软件0.8版本Canopy算法分析的数据处理流程
摘要:
mahout软件0.8版本Canopy算法分析的数据处理分为以下三个步骤:从数据库提炼你需要处理的数据的字段依据提炼的数据处理为vectors将处理后的vectors数据读取一、从数据库提炼数据这是一个sqoop-->>hive-->>hdfs转储为vectors的过程原理:首先通过sqoop将数据... 阅读全文
posted @ 2013-12-10 18:36 AI001 阅读(248) 评论(0) 推荐(0)
浙公网安备 33010602011771号