99

一.安装Hive

下载解压重命名权限

配置环境变量  $HIVE_HOME

修改Hive配置文件 gedit

配置mysql驱动

下载合适版本的mysql jar包,拷贝到/usr/local/hive/lib目录下 ls

在mysql新建hive数据库 show databases;

配置mysql允许hive接入  show grants for 'hive'@'localhost';

启停

启动Hadoop--启动Hive--退出Hive--停止Hadoop

二、Hive操作

hive创建与查看数据库

mysql查看hive元数据表DBS

hive创建与查看表

mysql查看hive元数据表TBLS

hdfs查看表文件位置

hive删除表

mysql查看hive元数据表TBLS

hive删除数据库mysql

查看hive元数据表DBS 

hdfs查看表文件夹变化

三、hive进行词频统计

准备txt文件

启动hadoop,启动hive

创建并查看文本表  create table

 

导入文件的数据到文本表中 load data local inpath

分割文本 split

行转列explode

 

统计词频group by

posted @ 2021-12-21 16:07  coffeeshop  阅读(33)  评论(0编辑  收藏  举报