07 HBase操作

1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。

  • 行键:每个HBase表都由若干行组成,每个行由行键(row key)来标识。
  • 列族:一个HBase表被分组成许多“列族”(Column Family)的集合,它是基本的访问控制单元。
  • 列限定符:列族里的数据通过列限定符(或列)来定位。
  • 时间戳:每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳进行索引。

2.启动HDFS,启动HBase,进入HBaseShell命令行。

3.列出HBase中所有的表信息list

4.创建表create

5.查看表详情desc

 6.插入数据put

7.查看表数据scan

 尝试分别用MySQL和HBase创建以下表:

    信息   分数
  学号   姓名   性别  大数据   操作系统
      80 50
         

 

8.多版本实验:修改列族版本数,插入多版本数据,查看多版本数据

 (1)创建表t2(列族f1、f2)并查看,此时版本数为1

      create 't2','f1','f2'

(2)修改列族f1的版本数为5

(3)插入多版本数据

  (4)查看多版本数据

9.对比HBase列式表与MySQL的行式表

  • 在HBase中创建学生课程分数表student并查看表结构。create,describe
    (1)创建student表及info列族
  • 在mysql中创建学生表student, 课程表 course, 分数表score并查看表结构。

  • 分别插入几行数据,几个版本。put/insert
    (2)添加第一行姓名、年龄数据,添加第二行年龄数据

     (3)修改版本数为3,再次在同一位置插入数据22

    (4)查看该单元格两个版本的数据

     

    (5)插入info列族sex列数据

     

    (6)增加列族score,并在相应列插入数据

  • 查看数据及版本。get,scan/select
      student表结果如下:

    

 

info

score

name

age

sex

OS

BD

row1

…3624

xianming

…3447

19

   

85

90

row2

   

…6395

…7611

19

22

       

row3

       

…4968

femal

   

posted @ 2021-11-05 11:42  鸢瑾  阅读(235)  评论(0)    收藏  举报