摘要:
1、group by代替distinct去重 2、减少模糊查询如like,以最大化利用索引 3、表连接前利用where筛选 4、减少不必要的字段查询 5.尽量使用select 具体字段代替select * 6、防止数据倾斜 7、合理利用分区 8、使用union all减少连接次数,且方便后续优化 9 阅读全文
posted @ 2022-08-27 23:09
萧六弟
阅读(20)
评论(0)
推荐(0)
摘要:
1.留存指标 新用户的留存和所有用户留存不太一样 方法一:python import pandas as pddf=pd.read_csv('user_behavior.csv')df=df[['user_id','timestamps']]df['timestamps']=pd.to_dateti 阅读全文
posted @ 2022-08-27 21:35
萧六弟
阅读(47)
评论(0)
推荐(0)

浙公网安备 33010602011771号