摘要: 前置知识(上一篇):海量列式非关系数据库HBase 架构,shell与API HBase读数据流程: 前置关键词描述: Block Cache :读缓存,缓存上一次读的数据,整个ReginServer只有一个 MemStore :写缓存,缓存上一次写的数据,每个Store有一个 WAL: 预写入日志 阅读全文
posted @ 2021-09-15 09:47 wangheng1409 阅读(344) 评论(0) 推荐(0) 编辑
摘要: HBase的特点: 海量存储: 底层基于HDFS存储海量数据 列式存储:HBase表的数据是基于列族进行存储的,一个列族包含若干列 极易扩展:底层依赖HDFS,当磁盘空间不足的时候,只需要动态增加DataNode服务节点就可以 高并发:支持高并发的读写请求 稀疏:稀疏主要是针对HBase列的灵活性, 阅读全文
posted @ 2021-09-14 23:10 wangheng1409 阅读(205) 评论(0) 推荐(1) 编辑
摘要: 前奏知识:参考上一篇:分布式协调组件 Zookeeper,选举机制与ZAB协议 ZooKeeper是⼀个典型的发布/订阅模式的分布式数据管理与协调框架,我们可以使⽤它来进⾏分布式 数据的发布与订阅。另⼀⽅⾯,通过对ZooKeeper中丰富的数据节点类型进⾏交叉使⽤,配合Watcher 事件通知机制, 阅读全文
posted @ 2021-09-02 13:31 wangheng1409 阅读(175) 评论(0) 推荐(0) 编辑
摘要: 本系列共2篇,下篇为:分布式协调组件Zookeeper实践之 服务器动态上下线 和分布式锁实现 Zookeeper简介: Zookeeper是什么: Zookeeper 是⼀个分布式协调服务的开源框架。 主要⽤来解决分布式集群中应⽤系统的⼀致性问题, 例如怎样避免同时操作同⼀数据造成脏读的问题。分布 阅读全文
posted @ 2021-09-02 12:06 wangheng1409 阅读(232) 评论(0) 推荐(0) 编辑
摘要: Impala是什么: Impala是Cloudera提供的⼀款开源的针对HDFS和HBASE中的PB级别数据进⾏交互式实时查询(Impala 速度快),Impala是参照⾕歌的新三篇论⽂当中的Dremel实现⽽来,其中旧三篇论⽂分别是 (BigTable,GFS,MapReduce)分别对应我们即将 阅读全文
posted @ 2021-08-29 15:36 wangheng1409 阅读(362) 评论(0) 推荐(1) 编辑