摘要: 第10章 Python Spark RDD RDD概念: Spark的核心是RDD,即是弹性分布式数据集,是一种分布式的内存系统数据集的应用;Spark的主要优势来自RDD本身的特性,RDD能与其他系统兼容,可以导入外部存储系统的数据集,例如HDFS、HBase、Hadoop数据源。 10.1 RD 阅读全文
posted @ 2021-02-09 15:34 山枫叶纷飞 阅读(146) 评论(0) 推荐(0)