摘要: RDD Resilient Distributed Dataset:弹性分布式数据集 可存储计算逻辑的一种数据集 RDD特性 可分区:提高消费能力,更适合并行计算 弹性: 存储的弹性:内存和磁盘的自动切换; 容错的弹性:数据丢失可自动恢复; 计算的弹性:计算出错重试机制; 分片的弹性:可根据需要重新 阅读全文
posted @ 2020-06-11 14:06 yltf 阅读(200) 评论(0) 推荐(0)