2.评价推荐系统 & 策略验证方法
一、推荐系统评价指标
- CTR(点击率)= 点击量 /曝光量
- CTR只能作为本系统不同策略的比较指标,不同系统的CTR比较没有意义
- 缺点在于,对三俗内容点击率可能比较高,避不开长尾问题
- UCTR = 有点击行为对的用户 / 访问用户总量
- 如果CTR高,UCTR底说明可能存在用户流失。
- 覆盖度 = 推出内容量 / 库内容量
- 对于UDC平台(用户为信息创造者),用户生产内容长时间不被消费意味着生产者流失。
- 小众内容不被曝光,推荐系统进入信息茧房。
针对特定的产品形态
小视屏: 人均时长 = 总观看时长 /总人数
商品: 购买率 = 购买人数 /总人数
二、策略验证之 AB test
原则:控制变量&避开特殊情况(如11.11)
了解AB Test之前首先了解一个属于 baseline(基线),顾名思义,基础策略,机器学习和深度学习过程中,幺六型baseline的学习,
实战中,成熟的推荐系统都是在baseline基础之上新增策略。
例如。
日期 | bucket1 | bucket2 |
12月6日 | 7% | 7.2% |
12月7日 | 7.2% | 7.5% |
b2-b1 = 0.02
b2-b1 = 0.03
效果提升了0.1个点。
部分公司AABtest,有两个基线筒。
试验后,新增册率如果对效果影响不大,说明新策略和原有策略存在荣誉。
适当的冗余可以提高筒的稳定性。
有时候,新策略的效果给leader看了效果可能不好,还是会上,这是为什么呢?
因为,新策略往往会破除长尾效应,和信息茧房。
posted on 2021-05-13 12:49 life‘s_a_struggle 阅读(714) 评论(0) 编辑 收藏 举报