摘要: 一、RDD、DataFrame和DataSet 1,共性 1、RDD、DataFrame和DateSet全都是spark平台下的弹性分布式数据集 2、三者都有惰性机制,在进行创建、转换,如map方法时,不会立即执行,只有在遇到Action如foreach时,三者才会开始遍历 3、三者都有partit 阅读全文
posted @ 2020-07-23 09:05 MXC肖某某 阅读(192) 评论(0) 推荐(0) 编辑