09 Hive安装与操作

一.安装Hive

下载解压重命名权限

配置环境变量  $HIVE_HOME

修改Hive配置文件 gedit

 

 

 

 

配置mysql驱动

(1)下载合适版本的mysql jar包,拷贝到/usr/local/hive/lib目录下 ls

 

 

(2)在mysql新建hive数据库 show databases;

(3)配置mysql允许hive接入  show grants for 'hive'@'localhost';

(4)启停(启动Hadoop--启动Hive--退出Hive--停止Hadoop)

 

 

二、Hive操作

hive创建与查看数据库

mysql查看hive元数据表DBS

hive创建与查看表

mysql查看hive元数据表TBLS

hdfs查看表文件位置

 

 

 

 hive删除表

mysql查看hive元数据表TBLS

hive删除数据库

mysql查看hive元数据表DBS 

 

三、hive进行词频统计

  0、 为什么要使用Hive?

Hive利用HDFS存储数据,利用MapReduce查询分析数据。因为直接使用Hadoop MapReduce处理数据,会面临人员学习成本太高的问题,而且MapReduce实现复杂查询逻辑开发难度太大。而使用Hive,操作接口采用类SQL语法,提供快速开发的能力的同时还避免了去写MapReduce,从而减少开发人员的学习成本,功能扩展更加方便

1、准备txt文件

 2、启动hadoop,启动hive

3、创建并查看文本表  create table

4、导入文件的数据到文本表中 load data local inpath

 5、分割文本 split

6、行转列explode

7、统计词频group by

posted @ 2021-12-17 08:15  TT333  阅读(49)  评论(0)    收藏  举报