2025 年 1月 17 日随笔档案 - leapss

2025年1月17日

摘要：（1）spark 计算速度快 spark将每个任务构建成DAG进行计算，内部的计算过程通过弹性式分布式数据集RDD在内存在进行计算，相比于hadoop的mapreduce效率提升了100倍。（2）易于使用 spark 提供了大量的算子，开发只需调用相关api进行实现无法关注底层的实现原理。通用的阅读全文

posted @ 2025-01-17 20:39 leapss 阅读(18) 评论(0) 推荐(0)