12 2020 档案
摘要:在大规模数据量的数据分析及建模任务中,往往针对全量数据进行挖掘分析时会十分耗时和占用集群资源,因此一般情况下只需要抽取一小部分数据进行分析及建模操作。Hive提供了数据取样(SAMPLING)的功能,能够根据一定的规则进行数据抽样,目前支持数据块抽样,分桶抽样和随机抽样,具体如下所示: 数据块抽样(
阅读全文
摘要:LTV概念 用户终身价值(life time value) 解释 LTV是在一定时间内,某一客户可能为企业带来的利润额. 顾客终身价值是指企业在获得新顾客后的一段时间内,每一位顾客的平均利润净现值。(该解释取自百度百科) 作用 1、对比各日(或各批次)新注册用户的质量,为日后导人做决策依据(所有会影
阅读全文
摘要:Hive中HSQL中left semi join和INNER JOIN、LEFT JOIN、RIGHT JOIN、FULL JOIN区别 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进
阅读全文
摘要:PostgreSQL date_trunc() 截断日期函数,完成定时时间语法 Oracle有大量的日期函数可供使用,trunc, new_time,months_between,next_day,last_day,add_months,round等函数.当然PostgreSQl 也有大量的时间函数
阅读全文

浙公网安备 33010602011771号