摘要: 衍生特征时, 统计每个类目id的用户的购买次数、金额, 用了下面语法, 发现效率很低. 更改, 先用聚合的concat把结果存在一个字符串中, 在从字符串中取出字段值, 效率大为提升. 猜测原理是, 多个聚合函数导致重复计算. 改为一个稍微复杂的函数, 仍然很快. 时间从2小时变为20分钟. 阅读全文
posted @ 2019-02-23 21:45 bregman 阅读(106) 评论(0) 推荐(0)