Base组件梳理
列式和列簇的理解:
列式

一个列对应一个字段。
列式

在列簇中,相似属性的字段归于同一个列簇下,表现为该列簇的列限定符。
架构


RegionServer中,多个Region共用一个HLog操作文件(原因是减少Pc查询寻址I/O开销)
已经刷写入HDHS的数据,不会通过利用HLlog来恢复数据,而此时的HLog中操作日志是记录
memstore缓存的操作日志。
工作流程
HBase启动发生了什么?
-
检查健康状态
Hmaser去监控管理RegionServer的存活状态
如果服务器宕机,进行服务器数据的恢复
-
Client如何加速查询
- 依据客户端的离线操作记录(cache)查询;
- Region中的memstore缓存中查询
-
如何查询数据
根据zookeeper的三层架构路径寻址。
Region拆分

Memstore拆分
- 文件数处于[3,10)
- 达到一定限定阈值
1.中的过程date数据格式化处理写入的时间大于2.中刷新处理时间
为什么要进行storefile文件合并操作
-
减少文件数量
-
打开文件的I/O启动的查询时间要大于文件查询的时间
客户端的读写操作
写操作:

读操作:

浙公网安备 33010602011771号