HIVE----count(distinct ) over() 无法使用解决办法【转载】

解决方法:
collect_set(a) over(partition by b)函数将合并成一个分好组的集合 然后求出集合的值个数
因为collect_set()不能放入重复函数所以使用size()求集合元素数量时能达到count(distinct )的效果
size(collect_set(a) over(partition by b))

原链接:
https://blog.csdn.net/weixin_44868723/article/details/110186210?utm_medium=distribute.pc_relevant.none-task-blog-2~default~BlogCommendFromMachineLearnPai2~default-2.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2~default~BlogCommendFromMachineLearnPai2~default-2.nonecase

posted @ 2021-06-22 17:27  DeusJin  阅读(481)  评论(0)    收藏  举报