摘要: Spark简介 Apache Spark是用于大规模数据处理的统一分析引擎,基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将Spark部署在大量硬件之上,形成集群。 Spark源码从1.x的40w行发展到现在的超过100w行,有1400多位大牛贡献了代码 阅读全文
posted @ 2021-01-29 09:53 五分钟学大数据 阅读(2645) 评论(4) 推荐(1) 编辑