随笔-306  评论-12  文章-0 

hadoop的版本问题

现在hadoop的版本比较乱,常常搞不清楚版本之间的关系,下面简单的摘要了,apache hadoop和cloudera hadoop 的版本的演化.

 

apache hadoop官方给出的版本说明是:

1.0.X - current stable version, 1.0 release

1.1.X - current beta version, 1.1 release

2.X.X - current alpha version

0.23.X - simmilar to 2.X.X but missing NN HA.

0.22.X - does not include security

0.20.203.X - old legacy stable version

0.20.X - old legacy version

 

下图来自http://blog.cloudera.com/blog/2012/01/an-update-on-apache-hadoop-1-0/

可以简单说明apache hadoop和cloudera hadoop版本之间的变化关系

diagram-3 

0.20.x版本最后演化成了现在的1.0.x版本

0.23.x版本最后演化成了现在的2.x版本

hadoop 1.0 指的是1.x(0.20.x),0.21,0.22

hadoop 2.0 指的是2.x,0.23.x

CDH3,CDH4分别对应了hadoop1.0 hadoop2.0

 

董的博客有2篇文章也很清晰的解释了,hadoop版本以及各自的版本特性:

http://dongxicheng.org/mapreduce-nextgen/how-to-select-hadoop-versions/

http://dongxicheng.org/mapreduce-nextgen/hadoop-2-0-terms-explained/

apache-hadoop-versions

最后给出常见的下载hadoop不同版本的地址:

http://archive.apache.org/dist/hadoop/core/

http://archive.cloudera.com/cdh/3/

http://archive.cloudera.com/cdh4/cdh/4/

 

另外附注一个 hadoop各商业发行版的比较:

http://www.xiaohui.org/archives/795.html

posted on 2013-04-04 19:48 阿笨猫 阅读(...) 评论(...) 编辑 收藏