07 HBase操作

1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。

行键(Row Key):最大长度为64KB的任意字符串。与关系型数据库一样,行键是行的唯一标志。

列族(Column Family):这是理解列族数据库的关键概念。将数据行中的字段按照某种要求分成数个小组,每个小组包含若干个字段,每个小组就是列族。列族需要预先定义,并且不能随意修改。每行具有相同的列族,但不要求每个列族都存储数据。

列限定符(Qualifier):每个列族包含多个字段,限定符用于区分不同的字段。列限定符不需要预先定义,因此每行可以有不同数量的列限定符,也可以认为列限定符就是字段。

时间戳(Timestamp):每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳进行索引

2.启动HDFS,启动HBase,进入HBaseShell命令行。

 

 

 

 3.列出HBase中所有的表信息list

4.创建表create

 

 5.查看表详情desc

 6.插入数据put

7.查看表数据scan,get

scan:

get:

8.多版本实验:修改列族版本数,插入多版本数据,查看多版本数据

1)创建查看

 2)修改查看

 3)插入数据

 4)查看多个版本的数据

9.对比HBase列式表与MySQL的行式表

  • 在HBase中创建学生课程分数表student并查看表结构。create,describe,put
  • 在mysql中创建学生表student, 课程表 course, 分数表score并查看表结构。create,describe
  • 分别插入几行数据,几个版本。put/insert
  • 查看数据及版本。get,scan/select

 

message

score

name

age

sex

OS

BD

row1

…3624

xianming

…3447

19

   

85

90

row2

   

…6395

…7611

19

22

       

row3

       

…4968

femal

   

          

 

     message  score
  name age   sex  Big data  OS
 001  Peter 20  man 80 50
           

 

HBase:

1.创建一个学生表(create)

  2.插入信息(put)。

 3.查看表结构(describe)。

 4.查看表(scan)。

MySQL: 

学生表(student):

  查看学生表(select):

  课程表(course):

查看课程表(select):

 分数表(score):

 查看分数表(select):

 

posted @ 2021-11-14 12:32  Alice12824  阅读(49)  评论(0编辑  收藏  举报