09 Hive安装与操作
一.安装Hive
解压到虚拟机准备下载

更改文件名

修改文件权限

配置环境变量



二、Hive操作
创建查看数据表



删除表:

三、hive进行词频统计
1.准备txt文件

2.启动hadoop,启动hive

3.创建并查看文本表 create table

4.导入文件的数据到文本表中 load data local inpath


5.分割文本 split
查看数据表

分割文本

6.行转列explode

7.统计词频group by

8.准备txt文件

9.上传文件至hdfs

10.从hdfs导入文件内容到表wctext, 并查看hdfs源文件,hfds数据库文件

11.统计词频

12.词频统计结果存到数据表里,并查看表和文件
(1)创建表

(2)查看表和文件

13.本地调用本地hql文件进行词频统计,将结果保存为本地文件

14.退出hive,停止hadoop


浙公网安备 33010602011771号