摘要: (1)spark 计算速度快 spark将每个任务构建成DAG进行计算,内部的计算过程通过弹性式分布式数据集RDD在内存在进行计算,相比于hadoop的mapreduce效率提升了100倍。 (2)易于使用 spark 提供了大量的算子,开发只需调用相关api进行实现无法关注底层的实现原理。 通用的 阅读全文
posted @ 2025-01-17 20:39 leapss 阅读(13) 评论(0) 推荐(0)