MapReduce的运行流程
摘要:input:读取数据 map:将整个任务分割成多个task,每个task处理一部分数据 shuffle:对数据进行分区、排序、分组 reduce:将所有分割的任务的处理结果进行合并 output:将整个程序的结果进行输出 例如:文本中含有数据 hadoop hive hbase hadoop hiv
阅读全文
posted @ 2017-09-25 00:49
posted @ 2017-09-25 00:49
posted @ 2017-09-22 11:33
posted @ 2017-09-18 16:00
posted @ 2017-09-18 12:18
posted @ 2017-09-18 12:14
posted @ 2017-09-18 12:08
posted @ 2017-09-16 20:56