2016年4月10日
摘要: Spark是一个通用的大规模数据快速处理引擎。可以简单理解为Spark就是一个大数据分布式处理框架。基于内存计算的Spark的计算速度要比Hadoop的MapReduce快上50倍以上,基于磁盘的计算速度也快于10倍以上。Spark运行在Hadoop第二代的yarn集群管理之上,可以轻松读取Hado 阅读全文
posted @ 2016-04-10 01:52 松伯 阅读(1333) 评论(0) 推荐(0)