Base组件梳理


列式和列簇的理解:


列式

一个列对应一个字段。

列式

在列簇中,相似属性的字段归于同一个列簇下,表现为该列簇的列限定符。

架构


RegionServer中,多个Region共用一个HLog操作文件(原因是减少Pc查询寻址I/O开销)

已经刷写入HDHS的数据,不会通过利用HLlog来恢复数据,而此时的HLog中操作日志是记录

memstore缓存的操作日志。

工作流程


HBase启动发生了什么?

  • 检查健康状态

    Hmaser去监控管理RegionServer的存活状态

    如果服务器宕机,进行服务器数据的恢复

  • Client如何加速查询

    1. 依据客户端的离线操作记录(cache)查询;
    2. Region中的memstore缓存中查询
  • 如何查询数据

    根据zookeeper的三层架构路径寻址。

Region拆分

Memstore拆分

  1. 文件数处于[3,10)
  2. 达到一定限定阈值

1.中的过程date数据格式化处理写入的时间大于2.中刷新处理时间

为什么要进行storefile文件合并操作

  1. 减少文件数量

  2. 打开文件的I/O启动的查询时间要大于文件查询的时间

客户端的读写操作

写操作:

读操作:

posted on 2020-05-26 00:34  想你的夜哩  阅读(217)  评论(0)    收藏  举报