摘要:1. 定义job名字 SET mapred.job.name='customer_rfm_analysis_L1'; 这样在job任务列表里可以第一眼找到自己的任务。 2. 少用distinct, 尽量用group by 因为会把数据弄在一个reduce中,造成数据倾斜。distinct数据数量大于
阅读全文
02 2016 档案
摘要:1. 定义job名字 SET mapred.job.name='customer_rfm_analysis_L1'; 这样在job任务列表里可以第一眼找到自己的任务。 2. 少用distinct, 尽量用group by 因为会把数据弄在一个reduce中,造成数据倾斜。distinct数据数量大于
阅读全文
摘要:1. 对一列数据想看看,distinct的结果 选中数据区域(包含列名),插入pivot table 2. 想检查一个单元格的值在不在某一列中,并返回标志值 =IF (COUNTIF(B:B,A1),"Y","N") B表示你想搜索的列,A1表示你想查找匹配的值 3. 统计单元格个数 =count(
阅读全文
摘要:1。regexp_extract 语法: regexp_extract(string subject, string pattern, int index) 返回值: string 说明: 将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符。 第一参数: 要处理的
阅读全文
摘要:1. UV & PV UV: 店铺各页面的访问人数,一个用户在一天内多次访问店铺被记为一个访客(去重) ; Unique visitors PV: 店铺内所有页面的浏览总量(次数累加); page view, 通常是衡量一个网络新闻频道或网站甚至一条网络新闻的主要指标。 IPV:指买家找到您店铺的宝
阅读全文
|