摘要: 2. 首先,Spark 把中间数据放到内存中,迭代运算效率高。MapReduce 中计算结果需要落地,保存到磁盘上,这样势必会影响整体速度,而 Spark 支持 DAG 图的分布式并行计算的编程框架,减少了迭代过程中数据的落地,提高了处理效率。(延迟加载)其次,Spark 容错性高。Spark 引进 阅读全文
posted @ 2022-02-22 10:33 九月微凉 阅读(66) 评论(0) 推荐(0)