2022 年 2月 22 日随笔档案 - 九月微凉

2022年2月22日

摘要： 2. 首先，Spark 把中间数据放到内存中，迭代运算效率高。MapReduce 中计算结果需要落地，保存到磁盘上，这样势必会影响整体速度，而 Spark 支持 DAG 图的分布式并行计算的编程框架，减少了迭代过程中数据的落地，提高了处理效率。（延迟加载）其次，Spark 容错性高。Spark 引进阅读全文

posted @ 2022-02-22 10:33 九月微凉阅读(66) 评论(0) 推荐(0)

九月微凉

公告