随笔分类 -  spark入门学习

摘要:1、版本说明 + 在spark2.0版本以前,spakr编程接口是RDD(Resilient Distributed Dataset,弹性分布式数据集),spark2.0版本即以上,RDD被Dataset取代,Dataset比RDD更为强大,在底层得到了许多优化了。当然2.0+版本仍然支持RDD,但 阅读全文
posted @ 2019-04-20 16:32 自由与宁静 阅读(952) 评论(0) 推荐(0)