摘要:
现在要对最近7天的日志进行统计,统计结果格式如下,key(date(日期),hour(时间),site(网站))value:(pv (访问次数),uv(独立访问人数,相同的访客id去重))统计结果需要存至Hbase,使用spark写出伪代码 阅读全文
posted @ 2017-09-07 12:47
牵牛花
阅读(1248)
评论(1)
推荐(0)
摘要:
http://blog.csdn.net/UnionIBM/article/details/77850979 <dependency> <groupId>org.apache.hbase</groupId> <artifactId>hbase-spark</artifactId> <version> 阅读全文
posted @ 2017-09-07 12:31
牵牛花
阅读(545)
评论(2)
推荐(0)

浙公网安备 33010602011771号