会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
零、
博客园
首页
新随笔
联系
订阅
管理
随笔分类 -
菜鸟的日常摸爬滚打
记录在学习中遇到的问题、原因以及解决方法。虽然选择了猿却只有鱼的七秒记忆。
Hive SQL count(distinct)效率问题及优化
摘要:上周拿到了我的第一个工作任务,统计一个按天分区每天都有百亿条数据条的hive表中account字段的非重用户数(大概两千万)。后来又更改为按id字段分别统计每个id的用户数。 按照我数据库老师的教导,我很轻易的跳出来了count(distinct account)这个句子。然后写上了一行查询,等待了
阅读全文
posted @
2017-08-10 15:08
零、
阅读(4551)
评论(0)
推荐(0)
公告