随笔分类 -  Hbase

Hbase
摘要:关注公众号:大数据技术派,回复“资料”,领取1024G资料。 1 为什么需要二级索引 HBase的一级索引就是rowkey,我们仅仅能通过rowkey进行检索。假设我们相对Hbase里面列族的列列进行一些组合查询,就只能全表扫描了。表如果较大的话,代价是不可接受的,所以要提出二级索引的方案。 二级索 阅读全文
posted @ 2021-12-28 23:51 大数据技术派 阅读(1110) 评论(0) 推荐(0)
摘要:因为前面Hbase2集群出现过一次故障,当时花了一个周末才修好,就去了解整理了一些hbase故障的,事故现场可以看前面写的一篇:Hbase集群挂掉的一次惊险经历 一. HBCK一致性 一致性是指Region在meta中的meta表信息、在线Regionserver的Region信息和hdfs的Reg 阅读全文
posted @ 2021-10-08 22:54 大数据技术派 阅读(3219) 评论(0) 推荐(0)
摘要:有些时候需要我们去统计某一个hbase表的行数,由于hbase本身不支持SQL语言,只能通过其他方式实现。 可以通过一下几种方式实现hbase表的行数统计工作: 这里有一张hbase表test:test: hbase(main):009:0> scan 'test:test' ROW COLUMN+ 阅读全文
posted @ 2021-06-16 22:27 大数据技术派 阅读(1791) 评论(0) 推荐(0)
摘要:Hive系列文章 Hive表的基本操作 Hive中的集合数据类型 Hive动态分区详解 hive中orc格式表的数据导入 Java通过jdbc连接hive 通过HiveServer2访问Hive SpringBoot连接Hive实现自助取数 hive关联hbase表 Hive udf 使用方法 Hi 阅读全文
posted @ 2021-06-09 23:32 大数据技术派 阅读(1056) 评论(0) 推荐(1)