摘要:
恢复内容开始 大数据的分布式计算框架目前使用的最多的就是hadoop的mapReduce和Spark,mapReducehe和Spark之间的最大区别是前者较偏向于离线处理,而后者重视实现性,下面主要介绍mapReducehe和Spark两者的shuffle过程。 MapReduce的Shuffle 阅读全文
posted @ 2020-06-08 18:13
高少侠也在江湖
阅读(1560)
评论(0)
推荐(0)

浙公网安备 33010602011771号