大名鼎鼎的V

导航

07

1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。

        HBase是一个开源可伸缩的针对海量数据存储的分布式nosql数据库,它根据Google Bigtable数据模型来建模并构建在hadoop的hdfs存储系统之上。它和关系型数据库Mysql, Oracle等有明显的区别,HBase的数据模型牺牲了关系型数据库的一些特性但是却换来了极大的可伸缩性和对表结构的灵活操作。

在一定程度上,Hbase又可以看成是以行键(Row Key),列标识(column qualifier),时间戳(timestamp)标识的有序Map数据结构的数据库,具有稀疏,分布式,持久化,多维度等特点。

        行键:每个HBase表都由若干行组成,每个行由行键(row key)来标识。在表里面,每一行代表着一个数据对象。每一行都是由一个行键(Row Key)和一个或者多个列组成的。行键是行的唯一标识,行键并没有什么特定的数据类型,以二进制的字节来存储,按字母顺序排序。

        列族:一个HBase表备份组成许多"列族"(Column Family)的集合,他是基本的访问控制单元

        列限定符:列族里的数据通过列限定符(或例)来定位

        时间戳:每个单元格都保存着一份数据的多个版本,这些版本采用时间戳进行索引

 

2.启动HDFS,启动HBase,进入HBaseShell命令行。

 

 

3.列出HBase中所有的表信息list

 

 

4.创建表create

 

 

5.查看表详情desc

 

 

6.插入数据put

7.查看表数据scan,get

8.多版本实验:修改列族版本数,插入多版本数据,查看多版本数据

 

posted on 2021-11-16 22:34  大名鼎鼎的V  阅读(21)  评论(0编辑  收藏  举报