随笔分类 -  spark

大数据相关的点点滴滴
摘要:Spark简介 Spark是基于内存计算的大数据分布式计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性。 在Spark中,通过RDD(Resilient Distributed Dataset,弹性分布式数据集)来进行计算,这些分布式集合,并行的 阅读全文
posted @ 2016-08-08 22:59 小丑鱼1 阅读(968) 评论(0) 推荐(0)