liudehaos

还历史以真诚,还生命以过程。 ——余秋雨
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

随笔分类 -  hive

摘要:一、TopN问题 需要确定使用什么排名函数,包含三种函数:row_number()、rank()、dense_rank() 每个班级的分数为前3名的学生 1 --建表语句 2 create table score(sid string, class string, score int) 3 row 阅读全文

posted @ 2022-08-24 14:41 liudehaos 阅读(358) 评论(0) 推荐(0)

摘要:Hive优化(面试宝典) 1.1 hive的随机抓取策略 理论上来说,Hive中的所有sql都需要进行mapreduce,但是hive的抓取策略帮我们 省略掉了这个过程,把切片split的过程提前帮我们做了。 set hive.fetch.task.conversion=none; (一旦进行这么设 阅读全文

posted @ 2022-06-23 15:32 liudehaos 阅读(354) 评论(0) 推荐(0)

摘要:第三天笔记 第三天笔记 SQL练习Hive 常用函数关系运算数值计算条件函数日期函数重点!!!字符串函数Hive 中的wordCount1.1 Hive窗口函数1.1.1 聚合开窗函数聚合开窗函数实战:实战1:Hive用户购买明细数据分析实战1需求:1.1.2 排序开窗函数实战2:Hive分析学生成 阅读全文

posted @ 2022-06-23 15:29 liudehaos 阅读(471) 评论(0) 推荐(0)

摘要:案例一 练习:一:将下列数据加载hive表。 员工信息表emp:字段:员工id,员工名字,工作岗位,部门经理,受雇日期,薪水,奖金,部门编号英文名:EMPNO,ENAME,JOB,MGR,HIREDATE,SAL,BONUS,DEPTNO create table emp( EMPNO int ,E 阅读全文

posted @ 2022-06-23 15:22 liudehaos 阅读(297) 评论(0) 推荐(0)

摘要:sql:Hive实现按照指定格式输出每七天的消费平均数输出格式:2018-06-01~2018-06-07 12.29...2018-08-10~2018-08-16 80.67 答案:-- 1、先将日期进行切分得到年月日select split(date_time,'/'),cost from f 阅读全文

posted @ 2022-06-07 21:52 liudehaos 阅读(385) 评论(0) 推荐(0)

摘要:1.3 Hive的安装(前提是:mysql和hadoop必须已经成功启动了) 在之前博客中我有记录安装JDK和Hadoop和Mysql的过程,如果还没有安装,请先进行安装配置好,对应的随笔我也提供了百度云下载连接。 安装JDK: https://www.cnblogs.com/wyh-study/p 阅读全文

posted @ 2022-06-06 10:49 liudehaos 阅读(251) 评论(0) 推荐(0)