摘要:
在Hadoop中,每个MapReduce任务都被初始化为一个job,每个job又可分为两个阶段:map阶段和reduce阶段。这两个阶段分别用两个函数来表示。Map函数接收一个<key,value>形式的输入,然后同样产生一个<ey,value>形式的中间输出,Hadoop会负责将所有具有相同中间k 阅读全文
posted @ 2016-05-12 22:13
松伯
阅读(3865)
评论(0)
推荐(0)
摘要:
首先考虑表的自连接,其次是列的设置,最后是结果的整理. 文件内容: 输出结果: 参考:《Hadoop实战》 阅读全文
posted @ 2016-05-12 01:52
松伯
阅读(544)
评论(0)
推荐(0)
浙公网安备 33010602011771号