摘要: Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势: Spark提供了一个全面、统 阅读全文
posted @ 2017-11-05 13:22 大葱拌豆腐 阅读(497) 评论(0) 推荐(0)
摘要: 转载自:https://zhuanlan.zhihu.com/p/25772054 让代码分布式运行是所有分布式计算框架需要解决的最基本的问题。 Spark是大数据领域中相当火热的计算框架,在大数据分析领域有一统江湖的趋势,网上对于Spark源码分析的文章有很多,但是介绍Spark如何处理代码分布式 阅读全文
posted @ 2017-11-05 12:04 大葱拌豆腐 阅读(604) 评论(0) 推荐(0)