关于Hadooop
什么是Hadoop
1.Hadoop是一个有Apache基金会所开发的分布式系统基础架构
2.主要解决海量数据的存储和海量数据的分析计算问题
3.广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈
Hadoop组成
Hadoop1.x组成:MapReduce(计算+资源调度) HDFS(数据存储) Common(辅助工具)
Hadoop2.x组成:MapReduce(计算) Yam(资源调度) HDFS(数据存储) Common(辅助工具)
在Hadoop1.x时代,Hadoop中的MapRedce同时处理业务逻辑运算和资源的调度,耦合性较大,在Hadoop2.x时代,,增加了Yam。Yam只负责资源的调度,MapReduce只负责运算