摘要:
从三个点来说: 1)提供服务的对象 2)业务域 3)层次的划分 1)提供服务的对象 a、数据仓库的服务对象基本上是人。明细数据,聚合指标,转化率模型, 他们的目前用户都是人 b、数据中台的服务对象变成 人+机器。 用户标签、机器学习模型,数据挖掘模型,他们的目标是系统。比如说广告系统,推荐系统,风控 阅读全文
posted @ 2019-09-29 18:08
1101011
阅读(1529)
评论(0)
推荐(0)
摘要:
sql优化: 数据倾斜的处理方式: -- Q: 活动数据 和 对应的维表进行关联,其中某个活动特别的大。 A: 1) 给关联健加入一个随机的 1-10的值 2)将维度表 的关联健, 每个加上 1-10的值,将维度表扩充十倍。 3)然后将2个表进行join,从而来消除数据倾斜。 -- 尽量不使用cou 阅读全文
posted @ 2019-09-29 18:08
1101011
阅读(503)
评论(0)
推荐(0)

浙公网安备 33010602011771号