摘要: 概念与特性 RDD (Resilient Distributed Dataset)弹性分布式数据集,是 Spark 中最基本的数据处理模型。 弹性 存储:内存和磁盘的自动切换 容错:数据丢失可以自动恢复 计算:计算出错重试机制 分片:可根据需要重新分片 分布式:数据存储在大数据集群的不同节点上 数据 阅读全文
posted @ 2022-10-02 22:26 FireOnFire 阅读(124) 评论(0) 推荐(0)