摘要:
1.尽可能复用RDD 2.对多次使用的RDD进行持久化(cache、persist,持久化的几种策略:MEMORY_ONLY、MEMORY_AND_DISK、DISK_ONLY...等) 3.(类似mapjoin)对于大RDD join 小RDD的情况,可以使用广播变量的方式把小RDD的数据发送到各 阅读全文
posted @ 2021-03-30 14:41
Yang--123
阅读(40)
评论(0)
推荐(0)
浙公网安备 33010602011771号