摘要: 1、为何要BulkLoad 导入?传统的HTableOutputFormat 写 HBase 有什么问题?我们先看下 HBase 的写流程:通常 MapReduce 在写HBase时使用的是 TableOutputFormat 方式,在reduce中直接生成put对象写入HBase,该方式在大数据量... 阅读全文
posted @ 2015-05-27 17:11 数据手艺人 阅读(1193) 评论(0) 推荐(0)
摘要: 1、搭建环境 新建JAVA项目,添加的包有: 有关Hadoop的hadoop-core-0.20.204.0.jar 有关Hbase的hbase-0.90.4.jar、hbase-0.90.4-tests.jar以及Hbase资源包中lib目录下的所有jar包2、主要程序Java代码packagec... 阅读全文
posted @ 2015-05-27 16:47 数据手艺人 阅读(6595) 评论(1) 推荐(0)