摘要: 比如我们有这样一个表,表名是table1,这个表里面存储了某班同学中考所有的科目成绩, 假设如下: 这时候,老师要求查出每个科目同学的成绩排名,排名函数之前我们用的最多的就是row_number() over()了。但在默认情况下,这个排名函数是不分科目的,也就是不分组的,它会把所有的成绩按照高或低 阅读全文
posted @ 2017-06-16 12:52 Cein 阅读(1063) 评论(0) 推荐(0)
摘要: Count distinct是SQL分析时的祸根 首先:如果你有一个大的且能够容忍不精确的数据集,那像HyperLogLog这样的概率计数器应该是你最好的选择。但对于需要快速、精准答案的查询,一些简单的子查询可以节省你很多时间。 让我们以我们一直使用的一个简单查询开始:哪个图表的用户访问量最大? 首 阅读全文
posted @ 2017-06-16 12:43 Cein 阅读(1038) 评论(0) 推荐(0)