摘要: 微调 微调的目的有几个: 1. 和人类对齐,减少一些hullucination和toxic content; 2. 引入domain knowledge; 3. 做一些prompt engineering低效的事情,比如不用提供大量的样本。但是也有可能因此而产生灾难性遗忘。同时需要对样本量和质量进行 阅读全文
posted @ 2024-03-23 17:01 欧阳维斯诺夫斯基 阅读(43) 评论(0) 推荐(0)
摘要: Box-cox Transformation 背景 有很多时候我们需要把右偏(长尾)分布的数据进行数值变换,将其变为接近正态分布的形式,好使用统计工具。Box-cox的原理其实就是用一系列f(y;lambda)对y做变换尝试,看看哪一个变换f(lambda)能够使得Y'=f(Y)变成正态分布,越正态 阅读全文
posted @ 2024-03-19 14:16 欧阳维斯诺夫斯基 阅读(325) 评论(0) 推荐(0)
摘要: 在买量中,我们本质上想买的其实是“看了广告才买产品”的用户,我们把看广告当作treatment, 因此实际上是要算的恰好是平均因果效用ATE=p(y|T=1)-p(y|T=0),然后选择ATE高的用户,即HTE,也称为uplift,那么跟因果图怎么联系起来呢?考虑到用户属性会影响treatment, 阅读全文
posted @ 2024-02-19 11:42 欧阳维斯诺夫斯基 阅读(67) 评论(0) 推荐(0)
摘要: 因为网络的节点之间有影响力,比如假如对一个用户做投放会影响到另一个用户,因此如果单纯用随机实验的方式,特别是当用户量小的时候,会存在一些误差。因此facebook在一篇paper里面就介绍了,在这种情况下,可以先将用户做cluster,然后再把cluster作为实验分组的基本单元,确保实验组和对照组 阅读全文
posted @ 2024-02-16 17:25 欧阳维斯诺夫斯基 阅读(104) 评论(0) 推荐(0)
摘要: 学到了一个没什么用的新名词 比如,在大量买量的时候,app在appstore的排名也会相对靠前,使得对照组的app install也有增加。但是为啥要measure这个organic uplift? Ref: https://www.appsflyer.com/blog/measurement-an 阅读全文
posted @ 2024-02-15 18:13 欧阳维斯诺夫斯基 阅读(13) 评论(0) 推荐(0)
摘要: 推荐系统的bias有很多:position bias, popularity pias, selection bias, exposure bias, conformity bias (从众心理)等,针对不同的bias有不同的模型来解决。核心的问题还是,这些bias导致一部分优秀的item unde 阅读全文
posted @ 2024-02-15 16:57 欧阳维斯诺夫斯基 阅读(212) 评论(0) 推荐(0)
摘要: Gaas模式的讨论,这篇非常好 阅读全文
posted @ 2024-01-08 15:51 欧阳维斯诺夫斯基 阅读(11) 评论(0) 推荐(0)
摘要: Synthetic Minority Oversampling TEnichque TL;DR:通过数据增强minority class来使得模型能够学习到minority的特征分布。 主要思想:模型学不到minority是因为没有见到足够的minority样本,因此不确定哪个特征空间才是minor 阅读全文
posted @ 2023-12-19 11:00 欧阳维斯诺夫斯基 阅读(74) 评论(0) 推荐(0)
摘要: 欲望人会通过各种手段来欺骗理性人,让理性人放下警惕/抵抗,屈服于欲望。 1. 伪装得到真正的满足 在这种欺骗方式下,大脑会提前告诉自己,已经努力过并且立竿见影地获得了满足感/成就感/内心的平和,尽管努力的时间只有短短的半天/几个小时。在这种情况下,理性人就会放下警惕,反正我已经获得了自律带来的快乐。 阅读全文
posted @ 2023-09-11 13:24 欧阳维斯诺夫斯基 阅读(129) 评论(0) 推荐(0)
摘要: 不做日常,只玩剧情。实际上,只玩每个版本的剧情,就够体验游戏的核心玩法了。而要肝的部分,就不玩了。这样才是master游戏,而不是成为策划的slave。 阅读全文
posted @ 2023-08-24 14:59 欧阳维斯诺夫斯基 阅读(26) 评论(0) 推荐(0)