MapReduce的详细流程
摘要:不管是maptask还是reducetask 启动以后进程名都叫yarn child由applicationmaster启动上面的yarn child 数据来源由客户端负责划分输入切片:扫描输入目录中的所有文件 遍历每一个文件 按照128M规格划分范围例如一个200M的文件就能划分成两个split,
阅读全文
posted @ 2019-04-01 09:29
posted @ 2019-04-01 09:29
posted @ 2019-04-01 09:22