Spark中的RDD和DataFrame
摘要:
什么是DataFrame 在Spark中,DataFrame是一种以RDD为基础的分布式数据集,类似于传统数据库中的二维表格。 RDD和DataFrame的区别 DataFrame与RDD的主要区别在于,DataFrame带有schema元信息,即DataFrame所表示的二维表数据集的每一列都带有 阅读全文
posted @ 2020-02-08 16:42
哈萨K
阅读(571)
评论(0)
推荐(0)