摘要:
已知特征$X=x_1$的样本呈现$Y=y_1$的特点,或者$Y=y_1$的样本有$X=x_1$的特征,如何计算干预X对Y的影响 Eg. 看快手视频喜欢评论的用户活跃程度更高,那引导用户去发表评论能让他们更活跃么? 建模特征应该如何选择,以及特征通过那些途径最终影响Y Eg. 个人并不喜欢有啥放啥的建 阅读全文
已知特征$X=x_1$的样本呈现$Y=y_1$的特点,或者$Y=y_1$的样本有$X=x_1$的特征,如何计算干预X对Y的影响 Eg. 看快手视频喜欢评论的用户活跃程度更高,那引导用户去发表评论能让他们更活跃么? 建模特征应该如何选择,以及特征通过那些途径最终影响Y Eg. 个人并不喜欢有啥放啥的建 阅读全文
posted @ 2019-12-07 15:10
风雨中的小七
阅读(5753)
评论(0)
推荐(2)

## 背景 都说随机是AB实验的核心,为什么随机这么重要呢?有人说因为随机所以AB组整体不存在差异,这样才能准确估计实验效果(ATE) $$ ATE = E(Y_t(1) - Y_c(0)) $$ 那究竟随机是如何定义的呢? 根据Rubin Causal Model, 想要让上述估计无偏,随机实验需
如果你的产品改进方案本来就没啥效果当然怎么开实验都没用,但如果方案有效,请不要让 statistical Hack 浪费一个优秀的idea. 如果预期实验效果比较小,有哪些基础操作来增加实验显著性呢?
- 你的分类模型输出的概率只是用来做样本间的相对排序,还是概率本身?
- 你的训练数据本身分布如何是否存在Imbalanced Sample?
在解决分类问题的时候,可以选择的评价指标简直不要太多。但基本可以分成两2大类,我们今分别来说道说道
基于一个概率阈值判断在该阈值下预测的准确率
衡量模型整体表现(在各个阈值下)的评价指标
想要从本质上解决小样本估计不置信的问题,一个更符合思维逻辑的方法是我们先基于经验给出一个预期估计,然后不断用收集到的样本来对我们的预期进行更新,这样在样本量小的时候,样本不会对我们的预期有较大影响,估计值会近似于我们预先设定的经验值,从而避免像小样本估计不置信的问题。
在第一篇打分系统漫谈1 - 时间衰减我们聊了两种相对简单的打分算法Hacker News和Reddit Hot Formula,也提出了几个这两种算法可能存在的问题,这一篇我们就其中的两一个问题进一步讨论:
如何综合浏览量和点赞量对文章进行打分[期望效用函数->点赞率]
如何解决浏览量较小时,点赞率不置信的问题[wald Interval -> wilson]
浙公网安备 33010602011771号