会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
大数据算法工程师的自耕地
无他,但手熟尔
博客园
首页
新随笔
联系
订阅
管理
2016年5月5日
Hive UDF初探
摘要: 1. 引言 在 "前一篇" 中,解决了Hive表中复杂数据结构平铺化以导入Kylin的问题,但是平铺之后计算广告日志的曝光PV是翻倍的,因为一个用户对应于多个标签。所以,为了计算曝光PV,我们得另外创建视图。 分析需求: 每个DSP上的曝光PV,标签覆盖的曝光PV; 累计曝光PV,累计标签覆盖曝光P
阅读全文
posted @ 2016-05-05 18:03 Treant
阅读(6132)
评论(0)
推荐(0)
编辑
公告