摘要:
当生成完成一个HFile后,如果你不想因为出错而重做数据,建议在bulkimport之前,查看一下hfilehbase提供了一个查看HFile属性的包org.apache.hadoop.hbase.io.hfile.HFile$hbase org.apache.hadoop.hbase.io.hfile.HFileusage: HFile [-a] [-b] [-e] [-f <arg>] [-j] [-k] [-m] [-p] [-r <arg>] [-s <arg>] [-v]-a,--checkfamily Enable family check-b, 阅读全文
posted @ 2013-01-14 18:22
忠义两难全
阅读(170)
评论(0)
推荐(0)
摘要:
通过-D设置的参数在streaming中可以通过读取系统参数的方式获得,这里必须把 "."替换成"_";启动参数设置 -DSPLIT.PV.THRESHOLD=600python文件中加入如下代码:tmp = os.popen('echo $SPLIT_PV_THRESHOLD').readlines()Threshold = int(tmp[0]) 阅读全文
posted @ 2013-01-14 17:34
忠义两难全
阅读(102)
评论(0)
推荐(0)
浙公网安备 33010602011771号