大数据第二次作业

1.了解对比Hadoop不同版本的特性,可以用图表的形式呈现。
第一代称为Hdaoop1.0,第二代为Hdaoop2.0,第一代包括0.20x,0.21x,0.22x三大版本,第二代Hadoop包含0.23x和2.x两大版本,它们是一套全新的架构,均包含HDFS Federation和YARN两个系统,其中0.20.x最后演化成1.0.x,变成了稳定版,而0.21.x和0.22.x则增加了HDFS HA 等重要的新特征。

2.Hadoop生态的组成、每个组件的作用、组件之间的相互关系,以图例加文字描述呈现

 

 3.官网学习Hadoop的安装与使用,用文档的方式列出步骤与注意事项

1 .创建Hadoop用户

2.安装java
3.设置SSH登录权限
4.单机安装配置
5.伪分布安装配置
4. 评估华为hadoop发行版本的特点与可用性
华为在硬件上具有天然的优势,在网络、虚拟化、PC等方面都有很强的硬件实力。华为的Hadoop版本基于自主研发的Hadoop HA平台,具有构建NameNode、JobTracker、HiveServer的HA功能,进程故障后系统自动进行Failover,无须人工干预,这也是对Hadoop功能不足的小修补,远不如MapR解决得彻底。华为在Hadoop社区中的Contributor和Committer也是国内最多的,算是国内技术实力较强的公司。
posted @ 2020-09-19 20:09  yy0102  阅读(123)  评论(0编辑  收藏  举报