09 Hive安装与操作
一.安装Hive
下载解压重命名权限
配置环境变量 $HIVE_HOME
修改Hive配置文件 gedit


配置mysql驱动
(1)下载合适版本的mysql jar包,拷贝到/usr/local/hive/lib目录下 ls


(2)在mysql新建hive数据库 show databases;
(3)配置mysql允许hive接入 show grants for 'hive'@'localhost';
(4)启停(启动Hadoop--启动Hive--退出Hive--停止Hadoop)

二、Hive操作
hive创建与查看数据库

mysql查看hive元数据表DBS

hive创建与查看表

mysql查看hive元数据表TBLS

hdfs查看表文件位置


hive删除表

mysql查看hive元数据表TBLS

hive删除数据库

mysql查看hive元数据表DBS

三、hive进行词频统计
0、 为什么要使用Hive?
Hive利用HDFS存储数据,利用MapReduce查询分析数据。因为直接使用Hadoop MapReduce处理数据,会面临人员学习成本太高的问题,而且MapReduce实现复杂查询逻辑开发难度太大。而使用Hive,操作接口采用类SQL语法,提供快速开发的能力的同时还避免了去写MapReduce,从而减少开发人员的学习成本,功能扩展更加方便
1、准备txt文件

2、启动hadoop,启动hive

3、创建并查看文本表 create table

4、导入文件的数据到文本表中 load data local inpath

5、分割文本 split

6、行转列explode

7、统计词频group by


浙公网安备 33010602011771号