摘要: 1.尽可能复用RDD 2.对多次使用的RDD进行持久化(cache、persist,持久化的几种策略:MEMORY_ONLY、MEMORY_AND_DISK、DISK_ONLY...等) 3.(类似mapjoin)对于大RDD join 小RDD的情况,可以使用广播变量的方式把小RDD的数据发送到各 阅读全文
posted @ 2021-03-30 14:41 Yang--123 阅读(40) 评论(0) 推荐(0)