摘要: 1、什么是RDD? RDD 弹性分布数据集。它是个数据集。 2、RDD存在位置? RDD存在内存中,同时高度共享即RDD只读。 3、非循环的数据流模型:从稳定的物理存储(如分布式文件系统)中加载记录,记录被传入由一组确定性操作构成的DAG,然后写回稳定存储。DAG数据流图能够在运行时自动实现任务调度 阅读全文
posted @ 2017-07-26 17:31 弘一 阅读(184) 评论(0) 推荐(0)