1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。
行键:每个HBase表都由若干行组成,每个行由行键(row key)来标识。在表里面,每一行代表着一个数据对象。每一行都是由一个行键(Row Key)和一个或者多个列组成的。行键是行的唯一标识,行键并没有什么特定的数据类型,以二进制的字节来存储,按字母顺序排序。
列族:一个HBase表备份组成许多"列族"(Column Family)的集合,他是基本的访问控制单元
列限定符:列族里的数据通过列限定符(或例)来定位
时间戳:每个单元格都保存着一份数据的多个版本,这些版本采用时间戳进行索引
2.启动HDFS,启动HBase,进入HBaseShell命令行。


3.列出HBase中所有的表信息list

4.创建表create

5.查看表详情desc

6.插入数据put

7.查看表数据scan,get

 
8.多版本实验:修改列族版本数,插入多版本数据,查看多版本数据

 
 
 
9.对比HBase列式表与MySQL的行式表
- 在HBase中创建学生课程分数表student并查看表结构。create,describe,put
 - 在mysql中创建学生表student, 课程表 course, 分数表score并查看表结构。create,describe
 - 分别插入几行数据,几个版本。put/insert
 - 查看数据及版本。get,scan/select
 
| 
 
  | 
 info  | 
 score  | 
||||||
| 
 name  | 
 age  | 
 sex  | 
 OS  | 
 BD  | 
||||
| 
 row1  | 
 …3624  | 
 xianming  | 
 …3447  | 
 19  | 
 85  | 
 90  | 
||
| 
 row2  | 
 …6395 …7611  | 
 19 22  | 
||||||
| 
 row3  | 
 …4968  | 
 femal  | 
||||||

 
 
 
 
 
 
 

 
 
 
 
 
 
 
 
                    
                
                
            
        
浙公网安备 33010602011771号