HBase概述
1. 概述
HBase是基于Hadoop的一个非关系型数据库(NoSQL数据库),HBase存储底层也是基于HDFS存储的。HBase和Hive很像,Hive是数据仓库
2. HBase中的基本概念
- NameSpace:类似于关系型数据库的Database,每个命名空间下有多个表
- Table:表名
- Row:每一行代表一个数据对象,每一行都是以一个行键来进行唯一标识的
- Column:HBase中的每一列都由Column Family(列族)和Column Qualifier(列限定符)进行限定
- RowKey:可以唯一标识一行记录,不可被改变,改变的唯一方式,就是删除,然后再插入。
- Column Family:在定义HBase表的时候需要提前设置好列族,表中所有的列都需要组织在列族里面,在文件系统中,一个Column Family中的Column是存储在一起的。列簇一旦确定好,就不允许更改了,因为更改会影响到真实的物理存储。
- Column Qualifier:列族中的数据通过列表示来进行映射,Column Qualifer就是key,存储的数据就是对应的value
- Cell:由{rowkey, column Family:column Qualifier, time Stamp} 唯一确定的单元。cell 中的数据是没有类型的,全部是字节码形式存储。
- TimeStamp:每一个值都有一个timestamp,作为该值特定版本的标识符。
3. 画图理解

4. HBase架构体系
见笔记和文档
本文来自博客园,作者:jsqup,转载请注明原文链接:https://www.cnblogs.com/jsqup/p/16685906.html

浙公网安备 33010602011771号