摘要: 在 MapReduce 框架中, Shuffle 阶段是连接 Map 与 Reduce 之间的桥梁, Map 阶段通过 Shuffle 过程将数据输出到 Reduce 阶段中。由于 Shuffle 涉及磁盘的读写和网络 I/O,因此 Shuffle 性能的高低直接影响整个程序的性能。 Spark 也 阅读全文
posted @ 2021-08-16 15:26 五分钟学大数据 阅读(4380) 评论(0) 推荐(1) 编辑