见贤思小齐,知足常乐呵

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

最近在优化一个报表系统。leader 提示我可以用cube函数。在此记录一下使用:

1) cube

简称数据魔方。

可以实现hive多个任意维度的查询。

cube(a,b,c)  首先会对(a,b,c)进行group by,然后依次是(a,b),(a,c),(a),(b,c),(b),(c), 最后在对全表进行group by,他会统计所选列中值的所有组合的聚合。

也就是可以合并我们的一些组内group by系列任务。

2)案例:

 

posted on 2016-04-28 15:03  Suckseedeva  阅读(2454)  评论(0编辑  收藏  举报