随笔分类 -  hive学习

Hive 的一些相关学习笔记
摘要:一、数据倾斜的原因 1)、key分布不均 2)、业务数据本身的特性 3)、建表时候考虑不周 4)、某些sql语句本身就有数据倾斜 关键词 情形 后果 join ①其中一个表较小,但是key集中 ②大表与大表,但是分桶的判断字段0值或者 空值过多 ①分发到某一个或者某几个reducer上的数据远高于平 阅读全文
posted @ 2020-04-27 14:03 myc513 阅读(883) 评论(0) 推荐(0)
摘要:一、空字段赋值 1、函数说明 NVL:给值为NULL的数据赋值,它的格式是NVL(value,default_value)。它的功能是如果value为NULL,则NVL函数返回的defalt_value。否则返回value的值。如果两个参数为NULL,则返回NULL。 2、案例实测 -- 查询:如果 阅读全文
posted @ 2020-04-24 17:11 myc513 阅读(680) 评论(0) 推荐(0)
摘要:Hive排序 一、全局排序(order by) Order by:全局排序,只有一个reducer 1、使用 Order by 子句排序 升序:ASC,可以不写,默认是升序 降序:DESC,降序 2、order by 语句使用在select语句的结尾 3、案例实操 -- (1) 查询员工信息按工资升 阅读全文
posted @ 2020-04-24 14:20 myc513 阅读(1061) 评论(0) 推荐(0)