TendernessAholic  

1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。

表:HBase的数据同样是用表来组织的,表由行和列组成,列分为若干个列族,行和列的坐标交叉决定了一个单元格。

行:每个表由若干行组成,每个行有一个行键作为这一行的唯一标识。访问表中的行只有三种方式:(1)通过单个行键进行查询;(2)通过一个行键的区间来访问;(3)全表扫描。

列族:一个HBase表被分组成许多“列族”的集合,它是基本的访问控制单元。

列限定符:列族里的数据通过列限定符(或列)来定位

单元格:在HBase表中,通过行、列族和列限定符确定一个“单元格”(cell),单元格中存储的数据没有数据类型,总被视为字节数组byte[]

时间戳:每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳进行索引

 

2.启动HDFS,启动HBase,进入HBaseShell命令行。

 

 

3.列出HBase中所有的表信息list

4.创建表create

 

 

 

5.查看表详情desc

 

 

6.插入数据put

 

 

7.查看表数据scan

 

 

 

尝试分别用MySQL和HBase创建以下表:

    信息   分数
  学号   姓名   性别  大数据   操作系统
      80 50
         

 

 

 

 

 

 

 

 

create table user (
        user_id int unsigned not null primary key,
        name       char(10) not null,
        sex        char(20) not null,
        age      int(20)    not null,
        kemu   char(20) not null,
score int(20) not null );
insert into user values (096,"qy","womane","20","大数据","80");

8.多版本实验:修改列族版本数,插入多版本数据,查看多版本数据

 

 

 

 

9.对比HBase列式表与MySQL的行式表

  • 在HBase中创建学生课程分数表student并查看表结构。create,describe,put,alter
  • 在mysql中创建学生表student, 课程表 course, 分数表score并查看表结构。
  • 分别插入几行数据,几个版本。put/insert
  • 查看数据及版本。get,scan/select

 

 

 

info

score

name

age

sex

OS

BD

row1

…3624

xianming

…3447

19

   

85

90

row2

   

…6395

…7611

19

22

       

row3

       

…4968

femal

   

 

 

 

 

 

 

 

posted on 2021-11-05 08:53  TendernessAholic  阅读(35)  评论(0)    收藏  举报