摘要: 1. RDD RDD(Resilient Distributed Dataset)是弹性分布式数据集的简称。具有以下特点: RDD由一系列的分区组成,一个数据块对应一个分区 每个分区的数据有相应的函数对其进行计算 不同的RDD相互依赖 对于k-v键值对RDD数据,由分区器(Partioner)根据指 阅读全文
posted @ 2024-08-18 10:34 脆皮老弟 阅读(51) 评论(0) 推荐(0)