• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

蛋蛋的芳香

  • 博客园
  • 联系
  • 订阅
  • 管理

公告

View Post

大作业

1.下载学生课程分数文件并分析文件内容结构

2.上传文件到hdfs上

 

 

 

3.hive创建学生课程分数表

 

 

 

4.导入文件内容到hive表中并查看数据前10行

 

 

 

 

 

 

5.取出与自己名字相匹配的一个人的课程分数录入到HBASE

 

 

 

6.取出全体学生的姓名,进行字母在名字中出现频率的统计

(1)复制姓名文本文件

 

 

 

(2)编写Map函数

 

 

 

(3)编写Reduce函数

 

 

 

(4) 用Streaming提交MapReduce任务

上传

 

 

 

 

编写代码

 

保存提交

 

 

 

 

 

 查看是否成功

 

 

 

(5)查看统计运行结果

 

 

 

7.在hive中进行数据分析

(1)查询学生的总人数

 

 

 

(2)查询总共有哪些课程

 

 

 

(3)按学生名字的长度进行各长度人数的统计

 

 

 

 

 

 

 

 

 

(4)查询各个课程的选修人数

 

 

 

(5)查询操作系统课程的最高分数,最低分

 

 

 

 

 

 

(6)查询每个课程的平均分

 

 

 

(7)查询某学生各科成绩平均分

 

 

 

(8)查询选修了操作系统课程且成绩在90分以上的所有学生

 

 

 

(9)查询每科课程的成绩第一名的分数

 

 

 

(10)查询数据库课程前3名的学生及分数

 

 

 

 

posted on 2021-12-16 02:32  蛋蛋的芳香  阅读(181)  评论(0)    收藏  举报

刷新页面返回顶部
 
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3