Hive常用数据函数

CUME_DIST 小于等于当前值的行数/分组内总行数
–比如,统计小于等于当前薪水的人数,所占总人数的比例

 

PERCENT_RANK 分组内当前行的RANK值-1/分组内总行数-1
应用场景不了解,可能在一些特殊算法的实现中可以用到吧 ;

 

having 函数必须和group by 函数一起才可以使用,并且放在 分组的后面

 

posted @ 2021-07-07 18:21  faithtwo  阅读(69)  评论(0)    收藏  举报