2016 年 4月 10 日随笔档案 - 松伯

2016年4月10日

摘要： Spark是一个通用的大规模数据快速处理引擎。可以简单理解为Spark就是一个大数据分布式处理框架。基于内存计算的Spark的计算速度要比Hadoop的MapReduce快上50倍以上，基于磁盘的计算速度也快于10倍以上。Spark运行在Hadoop第二代的yarn集群管理之上，可以轻松读取Hado 阅读全文

posted @ 2016-04-10 01:52 松伯阅读(1333) 评论(0) 推荐(0)