• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

月亮咬了口李子

  • 博客园
  • 联系
  • 订阅
  • 管理

公告

View Post

第九次

一.安装Hive

 

1、下载解压重命名权限

 

 2、配置环境变量  $HIVE_HOME

3、修改Hive配置文件 gedit

4、配置mysql驱动

在mysql新建hive数据库show databases;

配置mysql允许hive接入  show grants for 'hive'@'localhost';

 

 

5、启停

 


二、Hive操作

  1. hive创建与查看数据库

     

     

  2. mysql查看hive元数据表DBS

     

     

  3. hive创建与查看表

     

     

  4. mysql查看hive元数据表TBLS

     

     

  5. hdfs查看表文件位置

     

     

     

     

     

  6. hive删除表
     

     

     

  7. mysql查看hive元数据表TBLS

     

     


     

  8. hive删除数据库

     

     

  9. mysql查看hive元数据表DBS 

     

     

     

三、hive进行词频统计

 

  1. 准备txt文件
  2. 启动hadoop,启动hive
  3. 创建并查看文本表  create table
  4. 导入文件的数据到文本表中 load data local inpath
  5. 分割文本 split

行转列explode

 

 

 


 

统计词频group by

准备txt文件

 

 

 

 

上传文件至hdfs

 

 

 

 

 

从hdfs导入文件内容到表wctext, 并查看hdfs源文件,hfds数据库文件

 

 

统计词频

 

 

词频统计结果存到数据表里,并查看表和文件

hive 查看统计结果

 

 hdfs 查看统计结果

 

 

 

本地调用本地hql文件进行词频统计,将结果保存为本地文件

 

 

 

 

 

 

退出hive,停止hadoop

posted on 2021-12-14 13:59  月亮咬了口李子  阅读(84)  评论(0)    收藏  举报

刷新页面返回顶部
 
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3