2016年5月12日
摘要: 在Hadoop中,每个MapReduce任务都被初始化为一个job,每个job又可分为两个阶段:map阶段和reduce阶段。这两个阶段分别用两个函数来表示。Map函数接收一个<key,value>形式的输入,然后同样产生一个<ey,value>形式的中间输出,Hadoop会负责将所有具有相同中间k 阅读全文
posted @ 2016-05-12 22:13 松伯 阅读(3865) 评论(0) 推荐(0)
摘要: 首先考虑表的自连接,其次是列的设置,最后是结果的整理. 文件内容: 输出结果: 参考:《Hadoop实战》 阅读全文
posted @ 2016-05-12 01:52 松伯 阅读(544) 评论(0) 推荐(0)