hadoop 集群间数据迁移

Link:http://www.cnblogs.com/sidmeng/archive/2012/04/01/2428283.html

    hadoop集群之间有时候需要将数据进行迁移,如将一些保存的过期文档放置在一个小集群中进行保存。

    使用的是社区提供的功能,distcp。用法非常简单:

    hadoop distcp hdfs://nn1:8020/foo/bar  hdfs://nn2:8020/bar/foo

    加上参数 -i 表示不用去管failure -m 设置map数

posted @ 2012-09-11 11:37  ccmaotang  阅读(420)  评论(0编辑  收藏  举报