Linux实验 HBase的安装与使用

HBase的安装与使用

一、HBase介绍

HBase 是一个分布式的、面向列的开源数据库,源于 Google 的一篇论文《BigT able:一个结构化数据的分布式存储系统》。HBase 以表的形式存储数据,表 有行和列组成,列划分为若干个列族/列簇(column family)。欲了解 HBase 的 官方资讯,请访问[HBase 官方网站](http://hbase.apache.org/)。 HBase 的运行有三种模式:单机模式、伪分布式模式、分布式模式。 单机模式:在一台计算机上安装和使用 HBase,不涉及数据的分布式存储;伪分 布式模式:在一台计算机上模拟一个小的集群;分布式模式:使用多台计算机实 现物理意义上的分布式存储。这里出于学习目的,我们只重点讨论单机模式和伪 分布式模式。

池鱼奥耶版权所有哈哈哈

二、安装与配置HBase

1.HBase安装 

1.1 使用工具filezilla将HBase安装包hbase-1.1.2-bin.tar.gz复制到/usr/local中

1.2 使用命令tar -zxvf hbase-1.1.2-bin.tar.gz,再使用命令mv hbase-1.1.2 hbase改名为hbase方便操作

 1.3 配置环境变量

使用命令vi ~/.bashrc,如果没有引入过 PATH 请在~/.bashrc 文件尾行添加如下内容:

 export PATH=$PATH:/usr/local/hbase/bin

如果已经引入过 PATH 请在 export PATH 这行追加/usr/local/hbase/bin,这里的“:”是分隔符。如下图:

 再使用命令source ~/.bashrc让环境变量配置生效

1.4 添加HBase权限

使用命令chmod 777  ./hbase或者chown -R localhost_xwj ./hbase,给用户添加操作权限,注意localhost_xwj为自己的主机名

 1.5查看HBase版本

使用命令/usr/local/hbase/bin/hbase version,如下图

 看到以上输出消息表示HBase已经安装成功,接下来将分别进行HBase单机模式和伪分布式模式的配置。

2.HBase配置

2.1单机配置略过

2.2伪分布模式配置 

1.配置/usr/local/hbase/conf/hbase-env.sh。命令如下:

 

 2.配置/usr/local/hbase/conf/hbase-site.xml 用命令 vi 打开并编辑 hbase-site.xml,命令如下:

vi /usr/local/hbase/conf/hbase‐site.xml

 3. 接下来测试运行 HBase。 第一步:首先登陆 ssh,之前设置了无密码登陆,因此这里不需要密码;再切换目录至/usr/local/hadoop ; 再启动 hadoop,如果已经启动 hadoop 请跳过此步骤。命令如下:

ssh localhost

cd /usr/local/hadoop

start‐dfs.sh

 第二步:切换目录至/usr/local/hbase;再启动 HBase.命令如下:

cd /usr/local/hbase 

start‐hbase.sh

jps

 进入 shell 界面:

 4.停止 HBase 运行,命令如下:

stop‐hbase.sh

 注意:如果在操作 HBase 的过程中发生错误,可以通过{HBASE_HOME}目录(/usr/local/hbase)下的 logs 子目录中的日志文件查看错误原因。 这里启动关闭 Hadoop 和 HBase 的顺序一定是: 启动 Hadoop—>启动 HBase—>关闭 HBase—>关闭 Hadoop

三、编程实践 

1.利用shell命令

1.1 HBase中创建表

HBase 中用 create 命令创建表,具体如下:

启动HBase:start-hbase.sh,jps查看进程启动

使用命令hbase shell进入编程界面,再输入 create 'student','Sname','Ssex','Sage','Sdept','course'。

此时,即创建了一个“student”表,属性有:Sname,Ssex,Sage,Sdept,course。因为 HBase 的表中会有一 个系统默认的属性作为行键,无需自行创建,默认为 put 命令操作中表名后第一个数据。创建完“student”表后,可通过 describe 命令查看“student”表的基本信息

 1.2HBase数据库基本操作

添加数据

HBase 中用 put 命令添加数据,注意:一次只能为一个表的一行数据的一个列,也就是一个单元格添加 一个数据,所以直接用 shell 命令插入数据效率很低,在实际应用中,一般都是利用编程操作数据。 当运行命令:put ‘student’,’95001’,’Sname’,’LiYing’时,即为 student 表添加了学号为 95001,名字为 LiYing 的一行数据,其行键为 95001 

命令执行截图如下,即为 student 表添加了学号为 95001,名字为 LiYing 的一行数据,其行键为 95001。

命令执行截图如下,即为 95001 行下的 course 列族的 math 列添加了一个数据。

 删除数据

1.delete

在 HBase 中用 delete 以及 deleteall 命令进行删除数据操作,它们的区别是:1. delete 用于删除一个数据, 是 put 的反向操作;2. deleteall 操作用于删除一行数据。

作用是删除student表中95001行Ssex列的一个单元格数据

可以使用get ‘student’,‘95001’命令查看student表中第95001行中的数据

 

 2.deleteall 

作用是删除student表中95001行中所有的数据

 查看数据

1.get命令

查看某表中某一行的数据

 2.scan命令

查看某表中的所有数据,因为之前删除了所以全没了

 删除表

删除表有两步,第一步先让该表不可用,第二步删除表。

 

 1.3查询表历史数据 

查询表的历史版本,需要两步

1.在创建表的时候指定表的版本数

2.插入数据,然后更新数据,使其产生历史版本数据

 

 3.查询时,指定查询的历史版本数,默认查出最新的数据

 1.4 退出HBase数据表操作

使用如下修改命令,重启hbase hadoop 进入浏览器,出现如下界面

 

 

posted @ 2020-04-15 11:59  池鱼奥耶  阅读(1158)  评论(0)    收藏  举报