HBase导入导出

blogposts中的数据可以被导出到本地文件系统或者HDFS中。

要导出数据到本地文件系统,可以这样做:

bin/hbase org.apache.hadoop.hbase.mapreduce.Driverexport blogposts
path/to/local/filesystem

 

要导出同一份数据到HDFS中,则这么做:

bin/hbase org.apache.hadoop.hbase.mapreduce.Driverexport blogposts
hdfs://namenode/path/to/hdfs

 

除了导出,也可以导入数据到HBase表中。可以从本地文件系统或者HDFS导入数据。与导出类似,从本地文件系统导入数据命令如下:

bin/hbase org.apache.hadoop.hbase.mapreduce.Driverimport blogposts
path/to/local/filesystem

 

从HDFS导入与之类似,可以像下面这样导入:

bin/hbase org.apache.hadoop.hbase.mapreduce.Driverimport blogposts
hdfs://namenode/path/to/hdfs(这是在hadoop的bin中执行,经试验,不需要前面这些东西。如果是从其他hadoop集群中导入数据至hbase可能需要hdfs://namenode,并未测试)

 

PS:

导出过程中出现类似于以下的错误:

ERROR org.apache.hadoop.hbase.mapreduce.TableInputFormatBase - Cannot
resolve the host name for /10.220.55.41 because of
javax.naming.OperationNotSupportedException: DNS service refused
[response code 5]; remaining name '41.55.220.10.in-addr.arpa'

查看hbase访问情况,hbase已启动但无法查看数据,经检查原因是新添加的两个节点dm6、dm7的相关信息并未加载至其他节点,修改后,问题解决。其实之前hbase是可以通过webUI查看到已打开的,但是无法访问hbase中的数据。

 

 

 



参考资料:
http://www.ituring.com.cn/article/4999

http://blog.sina.com.cn/s/blog_8fe6fb080100ubu2.html

 


转载请保留:http://www.cnblogs.com/Deron/archive/2013/03/31/2981934.html



posted on 2013-03-31 20:31 _Deron_ 阅读(...) 评论(...) 编辑 收藏

导航

公告