HBase
HBase & Redis
相似
HBASE 和 Redis的功能上比较相似,都是nosql类型的数据库
区别
读写性能
HBase写快读慢,HBase的读取时长通常是几毫秒
Redis的读取时长通常是几十微秒
数据类型
HBase和Redis都支持KV类型。但是Redis支持List、Set等更丰富的类型
数据量
Redis支持的数据量通常受内存限制,而HBase没有这个限制,可以存储远超内存大小的数据
部署难易
HBase部署需要依赖hadoop、zookeeper等服务,而Redis的部署非常简单
数据可靠性
HBase采用WAL,先记录日志再写入数据,理论上不会丢失数据
而Redis采用的是异步复制数据,在failover时可能会丢失数据
应用场景
HBase适合做大数据的持久存储,而Redis比较适合做缓存。如果数据丢失是不能容忍的,那就只能用HBase;如果需要一个高性能的环境,而且能够容忍一定的数据丢失,那完全可以考虑使用Redis。
HBase可以用来做数据的固化,也就是数据存储,做这个他非常合适。Redis适合做cache。可以用HBase+Redis实现数据仓库加缓存数据库,速度和扩展性都兼顾。
综合上述比较,我们可以看出。这两者都有各自擅长的领域,不存在相互替代。具体选用哪个服务,要根据具体业务场景、数据量选择最合适的方案。
reference
HBase和Redis的区别:https://zhuanlan.zhihu.com/p/348349493
1. 简介
定义
HBase是以 HDFS 为数据存储的,一种分布式、可扩展的 NoSQL 数据库
数据模型
Bigtable 是一个稀疏的、分布式的、持久的多维排序 map
该映射由行键、列键和时间戳索引;映射中的每个值都是一个未解释的字节数组
HBase 使用与 Bigtable 非常相似的数据模型。用户将数据行存储在带标签的表中。数据行具有可排序的键和任意数量的列。该表存储稀疏,因此如果用户喜欢,同一表中的行可以具有疯狂变化的列
逻辑结构

物理结构
HDFS不支持修改数据,所以HBase通过 添加数据并设置相应字段 来表示修改和删除数据

数据模型
1)Name Space
命名空间,类似于关系型数据库的 database 概念,每个命名空间下有多个表
HBase 两 个自带的命名空间,分别是 hbase 和 default,hbase 中存放的是 HBase 内置的表,default表是用户默认使用的命名空间
2)Table
类似于关系型数据库的表概念
不同的是,HBase 定义表时只需要 声明列族 即可,不需要声明具体的列。因为数据存储时稀疏的,所有往 HBase 写入数据时,字段可以 动态、按需 指定。因此,和关系型数据库相比,HBase 能够轻松应对字段变更的场景
3)Row
HBase 表中的每行数据都由一个 RowKey 和多个 Column(列)组成,数据是按照 RowKey 的字典顺序存储的,并且查询数据时只能根据 RowKey 进行检索,所以 RowKey 的设计十分重要
4)Column
HBase 中的每个列都由 Column Family(列族)和 Column Qualifier(列限定符)进行限定,例如 info:name,info:age。建表时,只需指明列族,而列限定符无需预先定义
5)Time Stamp
用于标识数据的不同版本(version),每条数据写入时,系统会自动为其加上该字段, 其值为写入 HBase 的时间
6)Cell
由{rowkey, column Family: column Qualifier, timestamp} 唯一确定的单元。cell 中的数据全部是字节码形式存贮,指的是 底层存储的一行数据
基本架构

2. API
public class HBaseConnection {
public static void main(String[] args) throws IOException {
//1. 创建连接配置对象
Configuration conf = new Configuration();
//2. 添加配置参数
conf.set("hbase.zookeeper.quorum","hadoop102,hadoop103,hadoop104");
//3. 创建连接
// 默认使用同步连接
Connection connection = ConnectionFactory.createConnection(conf);
// 也可以使用异步连接,但是不推荐使用
CompletableFuture<AsyncConnection> asyncConnection = ConnectionFactory.createAsyncConnection(conf);
//4. 使用连接
System.out.println(connection);
//5. 关闭连接
connection.close();
}
}

浙公网安备 33010602011771号