导入hbase01
数据导入有如下几种方式:
1.利用HBase提供的ImportTsv将csv文件导入到HBase (舍弃)
2.利用HBase提供的completebulkload将数据导入到HBase
3.利用HBase提供的Import将数据导入到HBase(舍弃)
实际生产环境上很难使用命令行的方式。毕竟源数据不可能直接用来写HBase。在数据迁移的过程中会涉及到数据清洗、整理归并等许多额外的工作。显然不够灵活。
本文用的是MapReduce+completebulkload
注意,不要使用reducer。mapper到reducer需要走网络,受限于集群带宽。
public static class DBMapper extends Mapper<LongWritable, DBImportBean, ImmutableBytesWritable, Put> {
static String family[] = {"studentinfo"};
Put put=null;
ImmutableBytesWritable rowkey=null;
@Override
protected void map(LongWritable key, DBImportBean value, Context context) throws IOException, InterruptedException {
rowkey = new Immutabl