随笔分类 -  Spark

摘要:RDD只是一个逻辑概念,在内存中并不会真正地为某个RDD分配存储空间(除非该RDD需要被缓存)。 数据操作分为transform()和action()两种。 transform()是一个单向操作,rdd1进行操作后会产生新的rdd2,不会修改rdd1。 依赖 窄依赖(NarrowDependency 阅读全文
posted @ 2021-12-26 22:52 Yu\.W 阅读(70) 评论(0) 推荐(0)