(1)Hadoop生态系统的各个组件及其关系:
(2)Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系:
HDFS是底层存储系统,YARN和Hbase基于它;
YARN相当于一个操作系统,MapReduce和Spark等框架基于它来计算;
Hbase是基于HDFS的分布式数据库。