一.安装Hive
- 下载解压重命名权限
 - 配置环境变量  $HIVE_HOME
 - 修改Hive配置文件 gedit
 - 配置mysql驱动
- 下载合适版本的mysql jar包,拷贝到/usr/local/hive/lib目录下 ls
 - 在mysql新建hive数据库 show databases;
 - 配置mysql允许hive接入  show grants for 'hive'@'localhost';
 
 - 下载合适版本的mysql jar包,拷贝到/usr/local/hive/lib目录下 ls
 - 启停
- 启动Hadoop--启动Hive--退出Hive--停止Hadoop
 
 - 启动Hadoop--启动Hive--退出Hive--停止Hadoop
 
二、Hive操作
- hive创建与查看数据库
![]()
![]()
 - mysql查看hive元数据表DBS
 - hive创建与查看表
 - mysql查看hive元数据表TBLS
 - hdfs查看表文件位置
 - hive删除表
 - mysql查看hive元数据表TBLS
 - hive删除数据库
![]()
 - mysql查看hive元数据表DBS 
![]()
 - hdfs查看表文件夹变化
 

三、hive进行词频统计
- 准备txt文件
 - 启动hadoop,启动hive
 - 创建并查看文本表  create table
 - 导入文件的数据到文本表中 load data local inpath
查看数据表
![]()
 - 分割文本 split
 - 行转列explode
 - 统计词频group by
 
 
8准备txt文件

9上传文件至hdfs

10.从hdfs导入文件内容到表wctext, 并查看hdfs源文件,hfds数据库文件

11.统计词频

12.词频统计结果存到数据表里,并查看表和文件



13.本地调用本地hql文件进行词频统计,将结果保存为本地文件

 

 
14退出hive,停止hadoop
 
四、期末大作业开始准备 期末大作业sc.docx
- 学生课程分数sc.text
 - HDFS
 - HBASE
 - MapReduce
 - Hive
 
                    
                





                
            
        
浙公网安备 33010602011771号