2020年5月7日
摘要: 多次对某个RDD进行transformation或者action,如果没有做RDD持久化,那么每次都要重新计算一个RDD,会消耗大量时间,降低Spark性能。 Spark非常重要的一个功能特性就是可以将RDD持久化在内存中。当对RDD执行持久化操作时,每个节点都会将自己操作的RDD的partitio 阅读全文
posted @ 2020-05-07 13:36 清浊 阅读(858) 评论(0) 推荐(0)