摘要: 今天学习mapreduce: 切片与 MapTask 并行度决定机制 1)问题引出 MapTask 的并行度决定 Map 阶段的任务处理并发度,进而影响到整个 Job 的处理速度。 思考:1G 的数据,启动 8 个 MapTask,可以提高集群的并发处理能力。那么 1K 的数 据,也启动 8 个 M 阅读全文
posted @ 2022-01-17 19:16 哦心有 阅读(50) 评论(0) 推荐(0)