摘要: Spark是基于内存计算的大数据并行计算框架。因为其基于内存计算,较Hadoop中MapReduce计算框架具有更高的实时性,同时保证了高效容错性和可伸缩性。从2009年诞生于AMPLab到现在已经成为Apache顶级开源项目,并成功应用于商业集群中。学习Spark就需要了解其架构及运行机制。Spa... 阅读全文
posted @ 2015-07-14 18:24 TonyChai 阅读(391) 评论(0) 推荐(0) 编辑