摘要: 1.对于要处理的文件集合会根据设定大小将文件分块,每个文件分成多块,不是把所有文件合并再根据大小分块,每个文件的最后一块都可能比设定的大小要小 块大小128m a.txt 120m 1个块 b.txt 500m 4个块 reducetask的并行度 1.reducetask并行度就是将原来的一个大任 阅读全文
posted @ 2019-02-27 10:43 喵喵帕斯 阅读(182) 评论(0) 推荐(0)