2019年7月12日

mapreduce图解系列

摘要: 1、Hadoop的hdfs https://www.cnblogs.com/jstarseven/p/7682293.html 2、Hadoop的yarn https://segmentfault.com/a/1190000018775822?utm_source=tag-newest 3、Hado 阅读全文

posted @ 2019-07-12 11:10 hdc520 阅读(378) 评论(0) 推荐(0)

spark数据分析导论

摘要: 1、spark的定义 spark是一个用来实现快速而通用的集群计算平台,高效的支持更多计算模式,包括交互式查询和流处理。 主要特点就是能够在内存中进行计算,即使在磁盘上进行计算依然比mapreduce更加高效。 2、spark的软件栈 (1)Spark Core实现Spark的基本功能,包括任务调度 阅读全文

posted @ 2019-07-12 11:04 hdc520 阅读(241) 评论(0) 推荐(0)

导航