会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
一y样
博客园
首页
新随笔
联系
订阅
管理
2020年5月8日
数仓day04----日志预处理2
摘要: 1.详细描述idmap的整个计算方案 (1)使用SparkSession对象读取用户不同类别的埋点日志,解析并抽取出相应的标识id,使用union进行合并,得到装有汇总标识id的rdd(ids) (2)利用ids分别构造图计算的vertex集合以及构造图计算的边集合(将出现次数小于2的边过滤掉) (
阅读全文
posted @ 2020-05-08 23:59 一y样
阅读(253)
评论(0)
推荐(0)
公告