摘要: hive2.0 函数大全: 官方连接:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-Built-inOperators 1、聚合函数 2、日期函数 3、条件函数 4、字符串函 阅读全文
posted @ 2022-10-19 23:20 大猫不发威 阅读(141) 评论(0) 推荐(0)
摘要: 1、 IF(条件表达式, a, b):条件判断为True时,返回a,为False则返回b select if(a>b,a,b) cc 2、COALESCE(col1, col2, col3...) :返回第一个不为null的值 select coalesce(col1,col2,col3...) f 阅读全文
posted @ 2022-10-19 21:56 大猫不发威 阅读(920) 评论(0) 推荐(0)
摘要: 在数据分析时,有一个概念叫钻取,分为上钻和下钻,其实就是逐层聚合。假如一张表tb,有 a/b/c/d四个字段,其中a/b/c是维度,d是度量。日常中,a/b/c可能是父级和子集的关系,如学校和年级,而更多的可能是交叉的关系,如年级和男女。基于维度之间的关系,在数据分析中经常会做逐层分析或交叉分析。其 阅读全文
posted @ 2022-10-13 23:52 大猫不发威 阅读(568) 评论(0) 推荐(0)
摘要: 由于工作主要涉及hive和MySQL,两个平台大部分函数在名称和功能上都是相同的 ,个别有差异,根据需要自去验证。 1、截取日期的部分 second(date):返回日期中的秒 minute(date):返回日期中的分钟 hour(date):返回日期中的小时 day(date):返回日期中的天 w 阅读全文
posted @ 2022-10-13 01:03 大猫不发威 阅读(5669) 评论(0) 推荐(0)
摘要: 1、(INNER) JOIN : 内链接,也就是交集。 这种拼接得到最少的数据量,效率较高,但在数据分析中使用频率非常低,原因是这种拼接不分主次表,在完成表拼接的同时也做了条件筛选。 而表拼接是比较初始的数据整理,过早排除一些数据是不明智的,往往不到最后的数据聚合无法确认哪些数据是否是必须的, 此时 阅读全文
posted @ 2022-10-12 21:20 大猫不发威 阅读(590) 评论(0) 推荐(0)
摘要: 通常我们提到SQL函数都能根据名字对函数功能猜个大概,但想必很多人第一次听到窗口函数的时候都是有点蒙圈,不知所云,而实际了解过后,叫窗口函数听起来有点变扭,但也还算说的过去。 通常情况下,SQL操作数据是基于同行(row)或者同列(column)的。无论是where条件还是还是函数聚合,默认都是同一 阅读全文
posted @ 2022-10-10 22:06 大猫不发威 阅读(431) 评论(0) 推荐(0)