广告拍卖模拟器获最佳论文奖
广告拍卖模拟器获最佳论文奖
在某计算广告研讨会(AdKDD)上,研究人员凭借AuctionGym模拟器获得最佳论文奖。该模拟器能够对强盗算法和强化学习方法进行稳健且可重复的评估,用于在线广告拍卖中的竞价策略学习。
竞价学习挑战
全球范围内的广告展示机会通常通过实时广告拍卖进行销售,每日进行数十亿次。参与拍卖的产品必须学习帮助广告客户实现目标的竞价策略。出价过高会导致为展示机会过度支付,而出价过低可能会失去机会。理论在此提供很少指导:实践中,学习出价需要大量试错。
AuctionGym解决方案
论文将学习竞价问题形式化为离策略、反事实估计和学习。在该形式化框架下,大多数现有解决方案遵循基于价值的范式,即模拟在特定拍卖中出价的结果,并使用该模型做出实时竞价决策。
这并非唯一选择:论文提出了问题的替代表述,利用基于策略和双重稳健的反事实估计器。这些方法的优点是消除了在尝试模拟每个拍卖结果时可能出现的偏差:它们提供了竞价策略预期带来真实价值的无偏估计。
拍卖理论背景
拍卖由称为广告交换的实体运行,其实现的机制决定哪个投标人赢得展示机会以及成本多少。即使对于看似简单的情况(如两个项目和两个投标人),收入最大化的拍卖机制仍未发现。
著名机制包括为真实投标的拍卖参与者最大化福利(Vickrey-Clarke-Groves拍卖)或为拍卖人最大化收入(Myerson拍卖)。然而,当今在线广告拍卖的异质性和复杂性使得理论分析困难。
实证观察局限
远离纯理论,我们可以通过实证观察进行推断和获得见解。问题在于实验数据获取成本高,观察数据解决的问题范围有限。此外,许多现代在线广告拍卖的设计在实践中可能鼓励战略竞价。
AuctionGym功能
AuctionGym提供了一种改进对拍卖动态理解的可重复验证方法。它以端到端方式模拟重复拍卖轮次,从展示机会到展示和 resulting 转化。
在AuctionGym中,投标人拥有私人目录,列出其广告、目标和这些目标的私人估值。这些估值可以从预设分布中抽取,或基于投标人的真实数据。
AuctionGym附带几种标准拍卖机制的实现,并跟踪多个结果指标,如拍卖人收入、投标人福利和盈余、广告支出回报率(ROAS)以及各种投标人遗憾概念。
代码已在https://github.com/amzn/auction-gym 公开释放,希望它能帮助研究人员和从业者获得对拍卖和竞价动态的见解,并开发和评估解决该领域开放问题的新颖机器学习方法。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
公众号二维码
公众号二维码