HIVE----count(distinct ) over() 无法使用解决办法【转载】
解决方法:
collect_set(a) over(partition by b)函数将合并成一个分好组的集合 然后求出集合的值个数
因为collect_set()不能放入重复函数所以使用size()求集合元素数量时能达到count(distinct )的效果
size(collect_set(a) over(partition by b))
解决方法:
collect_set(a) over(partition by b)函数将合并成一个分好组的集合 然后求出集合的值个数
因为collect_set()不能放入重复函数所以使用size()求集合元素数量时能达到count(distinct )的效果
size(collect_set(a) over(partition by b))