2019年12月5日

为什么不建议在 HBase 中使用过多的列族

摘要: 我们知道,一张 HBase 表包含一个或多个列族。HBase 的官方文档中关于 HBase 表的列族的个数有两处描述:A typical schema has between 1 and 3 column families per table. HBase tables should not be 阅读全文

posted @ 2019-12-05 11:32 cxhfuujust 阅读(298) 评论(0) 推荐(0) 编辑

HBase 中加盐之后的表如何读取:Spark 篇

摘要: 在 《HBase 中加盐之后的表如何读取:协处理器篇》 文章中介绍了使用协处理器来查询加盐之后的表,本文将介绍第二种方法来实现相同的功能。 我们知道,HBase 为我们提供了 hbase-mapreduce 工程包含了读取 HBase 表的 InputFormat、OutputFormat 等类。这 阅读全文

posted @ 2019-12-05 11:04 cxhfuujust 阅读(375) 评论(0) 推荐(0) 编辑

HBase 入门之数据刷写(Memstore Flush)详细说明

摘要: 接触过 HBase 的同学应该对 HBase 写数据的过程比较熟悉(不熟悉也没关系)。HBase 写数据(比如 put、delete)的时候,都是写 WAL(假设 WAL 没有被关闭) ,然后将数据写到一个称为 MemStore 的内存结构里面的,如下图: 如果想及时了解Spark、Hadoop或者 阅读全文

posted @ 2019-12-05 10:47 cxhfuujust 阅读(744) 评论(0) 推荐(0) 编辑

导航