摘要: 背景: 最近有接到业务上的这么个需求,每天计算圈定用户的一些标签,同时把新增和移除标签的信息及当前用户的信息发给下游,这个场景太少了,还是java开发使用场景广泛。 举例: 这个用户昨日新增了tag3和tag2这个标签,同时当前codes也是这2个 任务设计: 首先,存储每天的全量的计算结果,因为新 阅读全文
posted @ 2020-12-03 03:25 活不明白 阅读(42) 评论(0) 推荐(0)
摘要: 工作中同事有时候会需要随机排序,同事会全局写个order by rand(),然后几十亿的数据就会比较慢。 然后会这么改下。先随机分组下,再排序,随机效果应该差不多 distribute by floor(randbetween(1,10001)) sort by RAND(); 阅读全文
posted @ 2020-12-03 03:09 活不明白 阅读(31) 评论(0) 推荐(0)