再多学一点吧

导航

2021年11月16日 #

Spark优化

摘要: ###代码优化 1.避免使用重复的RDD 2.对经常使用的RDD进行缓存持久化 3.使用高性能的算子 reduceByKey(map端预聚合)替代groupByKey mapPartitions替代map Transformation foreachPartitions替代foreach Actio 阅读全文

posted @ 2021-11-16 21:01 糟糟张 阅读(61) 评论(0) 推荐(0) 编辑