摘要: 今天开始做实验四,看上去一头雾水。查阅相关博客资料才明白了RDD是什么东西。 Spark 对数据的核心抽象—弹性分布式数据集就是RDD,换句话说就是分布式的元素集合。在spark里,对数据的所有操作就是创建 RDD、转化已有 RDD 以及调用 RDD 操作进行求值。创建RDD有两种方法:读取一个外部 阅读全文
posted @ 2020-02-07 22:57 Triassic 阅读(107) 评论(0) 推荐(0) 编辑