摘要: RDD缓存: RDD缓存是spark中的重要特性。默认情况下,RDD的内容是临时的,每个RDD只能使用一次,如果某个RDD需要重复使用则需要从最开始的父RDD重新计算,计算量较大且耗时,使用缓存或持久化后,第一次计算出RDD内容之后,可以将每个RDD的结果缓存在集群的内存或磁盘中,后续调用以来该RD 阅读全文
posted @ 2020-03-22 23:00 佚名博主 阅读(297) 评论(0) 推荐(0)