见贤思小齐,知足常乐呵

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

02 2016 档案

摘要:1. 定义job名字 SET mapred.job.name='customer_rfm_analysis_L1'; 这样在job任务列表里可以第一眼找到自己的任务。 2. 少用distinct, 尽量用group by 因为会把数据弄在一个reduce中,造成数据倾斜。distinct数据数量大于 阅读全文
posted @ 2016-02-19 17:12 Suckseedeva 阅读(1541) 评论(0) 推荐(0)

摘要:1. 对一列数据想看看,distinct的结果 选中数据区域(包含列名),插入pivot table 2. 想检查一个单元格的值在不在某一列中,并返回标志值 =IF (COUNTIF(B:B,A1),"Y","N") B表示你想搜索的列,A1表示你想查找匹配的值 3. 统计单元格个数 =count( 阅读全文
posted @ 2016-02-03 16:55 Suckseedeva 阅读(369) 评论(0) 推荐(0)

摘要:1。regexp_extract 语法: regexp_extract(string subject, string pattern, int index) 返回值: string 说明: 将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符。 第一参数: 要处理的 阅读全文
posted @ 2016-02-01 15:15 Suckseedeva 阅读(92607) 评论(0) 推荐(6)

摘要:1. UV & PV UV: 店铺各页面的访问人数,一个用户在一天内多次访问店铺被记为一个访客(去重) ; Unique visitors PV: 店铺内所有页面的浏览总量(次数累加); page view, 通常是衡量一个网络新闻频道或网站甚至一条网络新闻的主要指标。 IPV:指买家找到您店铺的宝 阅读全文
posted @ 2016-02-01 14:14 Suckseedeva 阅读(9852) 评论(0) 推荐(0)