摘要:
1.rdd的数据是过程数据rdd之间进行相互迭代计算,当执行开启后,新rdd的产生,代表老rdd的消失rdd的数据是过程数据,只在处理的过程中存在,一旦处理完成,就不见了这样可以最大化的利用资源2.rdd的缓存sparkt提供了缓存api,可以让我们通过调用api,将指定的rdd数据保留在内存或者硬 阅读全文
posted @ 2024-01-25 13:22
zhangmingmingkjz
阅读(17)
评论(0)
推荐(0)
2024年1月25日