斯坦福-CS364b-机制设计笔记-全-

斯坦福 CS364b 机制设计笔记(全)

001:递增式与事后激励兼容机制)

在本节课中,我们将要学习机制设计的基本概念,并重点探讨递增式拍卖与事后激励兼容机制。我们将从简单的场景开始,逐步增加复杂性,并理解不同机制设计目标之间的权衡。

场景一:同质物品与单位需求

上一节我们介绍了课程概述,本节中我们来看看第一个简单场景。假设有K件完全相同的物品待售,例如一批旧款iPhone。每个竞拍者(共N个,且N > K)只想要其中一件物品,这被称为单位需求偏好。每个竞拍者i对其想要的物品有一个私人估值 v_i,这是他们愿意为该物品支付的最高价格。私人意味着只有竞拍者自己知道这个估值,卖方和其他竞拍者均不知情。

我们的目标是设计一个机制,在参与者是策略性的(即他们有自己的目标,可能与卖方目标冲突)的情况下,仍能获得良好的性能保证,例如最大化社会福利(即所有获胜者估值之和)。

直接显示机制:K-Vickrey拍卖

对于此问题,一个标准解决方案是使用K-Vickrey拍卖,它是第二价格密封拍卖在多物品情况下的推广。

以下是该拍卖的运作方式:

  1. 竞拍:每个竞拍者提交一个密封出价 b_i
  2. 分配:将物品分配给出价最高的K个竞拍者。
  3. 支付:每个获胜者支付的价格是第 (K+1) 高的出价(即最高失败出价)。

该拍卖具有以下优良特性:

  • 激励兼容性:诚实出价(即 b_i = v_i)是一个占优策略。这意味着无论其他竞拍者如何行动,诚实出价都能最大化竞拍者i的效用(效用 = 估值 - 支付价格)。这被称为占优策略激励兼容
  • 社会福利最大化:在诚实出价下,该拍卖能将物品分配给估值最高的K个竞拍者,从而最大化总社会福利。
  • 简单易行:该机制计算简单,可在多项式时间内完成。

递增式实现:英式拍卖

除了密封出价机制,我们还可以考虑递增式实现,例如大家熟悉的英式拍卖

以下是其运作方式:

  1. 拍卖师从一个很低的价格(例如0)开始。
  2. 价格以固定增量 ε 逐步上升。
  3. 在每一轮,拍卖师询问当前活跃的竞拍者是否愿意在当前价格下购买物品。
  4. 竞拍者回答“是”或“否”。回答“否”的竞拍者退出,且不能重新加入。
  5. 当愿意购买的竞拍者数量首次降至K或以下时,拍卖停止。
  6. 最终的K个(或少于K个)活跃竞拍者获胜,并支付拍卖停止时的价格。

在英式拍卖中,诚实竞价意味着:当被问及是否愿意在价格 p 下购买时,当且仅当你的估值 v_i ≥ p 时,你才回答“是”。

可以证明,在英式拍卖中:

  • 诚实竞价是一个占优策略(在 ε 趋近于0的连续情况下是精确的,在离散情况下有 ε 的误差)。
  • 在诚实竞价下,拍卖结果(随着 ε 趋近于0)同样能最大化社会福利。
  • 该机制同样简单易行。

因此,对于场景一,英式拍卖在激励、性能和简洁性方面与K-Vickrey拍卖同样优秀。

为何需要递增式拍卖?

既然直接显示机制(如K-Vickrey拍卖)已经如此完美,为何还要研究递增式拍卖?以下是几个关键原因:

  • 对竞拍者更简单:竞拍者无需思考并报告一个精确的估值,只需回答一系列简单的“是/否”问题。
  • 隐私与信任:在英式拍卖中,即使获胜,也没有人(包括拍卖师)知道你的确切估值,只知道一个下界(第二高的退出价格)。过程也更透明。
  • 价格发现与灵活性:当物品非同类时(后续场景),竞拍者可以在拍卖过程中根据观察到的竞争情况调整策略,这在实际中(如频谱拍卖)非常重要。
  • 潜在更高收益:竞价过程可能引发“竞价战”,从而为卖方带来更高收入。
  • 历史与传统:许多现实世界的拍卖(如艺术品拍卖)长期以来都采用递增式。

场景二:异质物品与可加估值

上一节我们讨论了同质物品,本节中我们来看看更复杂的情况。现在,我们有一组M个不同的物品。每个竞拍者i对每个物品j有一个私人估值 v_ij。我们假设估值是可加的,这意味着竞拍者对一组物品的估值等于她对其中每个物品估值之和。这排除了物品之间存在替代(拥有一个会降低对另一个的需求)或互补(同时拥有多个价值更高)关系。

直接显示机制:同时进行的Vickrey拍卖

对于此问题,一个简单的直接显示解决方案是同时运行M个独立的第二价格(Vickrey)拍卖,每个物品一个。因为估值可加,问题完全解耦。

  • 该机制是占优策略激励兼容的。
  • 在诚实出价下,它能最大化社会福利。
  • 它简单且易于计算。

递增式实现:同时进行的英式拍卖

一个自然的递增式实现是为每个物品同时运行一个独立的英式拍卖。价格同步上升,每个拍卖在其需求降至1时停止。

现在,关键问题是:在这种并行英式拍卖中,诚实竞价是否还是一个占优策略?答案是否定的。

反例说明
假设有两个竞拍者(1和2)和两个物品(A和B)。估值如下:

  • 竞拍者1:v_1A = 3, v_1B = 2
  • 竞拍者2:v_2A = 2, v_2B = 1
    如果都诚实竞价,竞拍者1将赢得两件物品,支付价格分别为2和1,获得效用 (3-2)+(2-1)=2
    然而,竞拍者2可以采用一个“触发策略”:如果竞拍者1在第一轮对物品A出价,那么竞拍者2将对两个物品都持续出价,直到价格超过自己的估值(即非诚实竞价),以此惩罚竞拍者1。如果竞拍者1诚实竞价(对A出价),就会触发这个策略,导致竞拍者1可能两件物品都得不到,效用为0。因此,诚实竞价不再是占优策略,因为存在其他竞拍者的某些行动(即使这些行动非理性)会使诚实竞价变得不利。

事后纳什均衡

上述例子表明,对于更丰富的交互式(递增式)机制,占优策略激励兼容的标准可能过于严格。我们需要一个更适合的概念:事后纳什均衡

其核心思想是:我们不强求一个策略在所有可能的对手行动下都是最优的,只要求它在所有对手都遵循一个指定的、合理的策略(此处指诚实竞价)时是最优的,无论对手们的具体私人估值是什么

形式化定义如下:
一个策略组合 S(每个竞拍者一个策略函数,将私人估值映射为行动)是一个事后纳什均衡,如果对于每个竞拍者 i,给定其私人估值 v_i,并且假设所有其他竞拍者 j ≠ i 都按照策略 S_j 行动(该策略依赖于他们各自的私人估值 v_j),那么竞拍者 i 遵循策略 S_i 所获得的效用,不低于他选择任何其他行动所能获得的效用。这里的关键是,这个最优性要求对所有其他竞拍者私人估值 v_j 的可能实现都成立。

对于场景二(可加估值,异质物品)中的并行英式拍卖,可以证明:

  • 诚实竞价不是一个占优策略均衡(如上例所示)。
  • 但是,诚实竞价构成一个事后纳什均衡。也就是说,如果每个竞拍者都相信其他所有人会诚实竞价,那么他自己诚实竞价就是最优反应,无论其他人的具体估值是多少。

“卓越”的递增式拍卖

基于此,我们可以为递增式拍卖定义一个类似于直接显示机制中“占优策略激励兼容+社会福利最大化+计算高效”的优良标准,我们称之为“卓越”的递增式拍卖:

  1. 事后激励兼容:诚实竞价构成一个事后纳什均衡。
  2. 性能保证:当所有竞拍者诚实竞价时,该机制能(近似)最大化社会福利。
  3. 计算高效:该机制可以在多项式时间内运行。

场景二中的并行英式拍卖就符合这个标准(考虑离散增量 ε 的误差)。

直接机制与递增式机制的关系

最后,我们探讨一下直接显示机制与递增式机制之间的联系。存在一个称为显示原理的经典结论:任何具有占优策略激励兼容的机制(无论是直接还是间接),都可以被“模拟”成一个等价的、直接显示且占优策略激励兼容的直接机制。

一个有趣的推论是:如果你有一个“卓越”的递增式拍卖(事后激励兼容且性能良好),那么你可以通过模拟这个递增式拍卖的过程,自动构造出一个等价的、占优策略激励兼容的直接显示机制。

这意味着:
设计一个事后激励兼容的卓越递增式拍卖,至少和设计一个占优策略激励兼容的直接显示机制一样困难。

因此,在我们试图为更复杂的问题设计递增式拍卖时,一个必要的前置步骤是:先检查是否存在一个性能良好的、占优策略激励兼容的直接显示机制。如果连这个都做不到,那么设计卓越递增式拍卖的希望就更渺茫了。这为我们后续的研究提供了一个清晰的路线图。

本节课中我们一起学习了机制设计的基本框架,比较了直接显示机制与递增式实现,并通过两个具体场景(同质物品单位需求、异质物品可加估值)深入理解了占优策略激励兼容与事后纳什均衡这两个核心激励概念。我们还建立了直接机制与递增式机制之间的难度关系,为后续探索更复杂的机制设计问题奠定了基础。

002:单位需求竞标者与瓦尔拉斯均衡

在本节课中,我们将学习如何为拥有单位需求但商品各不相同的竞标者设计一个具有良好性能的拍卖机制。我们将探讨瓦尔拉斯均衡的概念,并揭示其与维克瑞-克拉克-格罗夫斯机制支付价格之间的深刻联系。

课程安排与期望

上一节我们介绍了课程的整体目标,本节中我们来看看本学期的具体安排和期望。

本课程与秋季学期有相似之处,但也有不同。主要区别如下:

  • 无问题集:本学期没有秋季学期那种困难的问题集。
  • 研究项目:课程重点在于近五年的前沿研究。因此,学生需要完成一个研究项目。大约在第四周,我会发布一系列研究论文供深入阅读,最终需提交一份约15页的研究报告。报告可以是论文综述,也可以作为寻找研究课题的起点。
  • 练习集:本学期会有练习集,旨在帮助大家巩固对核心概念的理解。前半学期可能会有4-5套与秋季学期长度类似的练习,后半学期可能会减少到每套2-4个练习。练习集需要提交,相关政策与秋季学期相同。
  • 课堂出勤:虽然课程会被录像,但鉴于班级规模较小,我期望大家尽量出席课堂。录像可用于复习或弥补因故缺席的课程。
  • 课程笔记与阅读材料:我会像秋季学期一样提供课程笔记,但无法保证及时性。课程网站上也会提供相关的阅读材料。

关于工作量,我期望本课程的整体耗时比秋季学期略少,但这取决于个人在研究项目上的投入程度。

场景三:单位需求竞标者与异质商品

现在,让我们回到机制设计本身。我们的目标是设计一个拍卖,能在更复杂、更有趣的场景中有效分配稀缺商品,并获得良好的社会福利。我们最终关注的是能实现事后激励相容计算高效的增价拍卖。

上一讲我们提到,设计这种增价拍卖的一个前提是,至少需要存在一个良好的、直接显示的、占优策略激励相容机制。因此,我们将首先探索适用于场景三的这种机制。

场景三是场景一的严格推广,但与场景二(可加估值)不可比。

  • 与场景二相似:我们拥有M各不相同的商品。
  • 与场景一相似:竞标者具有单位需求

这意味着,竞标者 i 对商品 j 有一个私人估值 v_ij,但其对一个商品集合 S 的估值定义为该集合中单个商品的最高估值:

公式:v_i(S) = max_{j ∈ S} v_ij

单位需求意味着竞标者最多只想要一件商品,但他们对不同的商品有偏好差异。一个常见的例子是购房:一个人通常只买一套房,但愿意为不同的房子支付不同的价格。

我们的目标是:为场景三构建一个满足社会福利最大化占优策略激励相容多项式时间可计算的拍卖机制。这个问题的解决方案非常精妙,但我们需要深入理解这个场景才能证明其正确性。

可行性检查:直接显示机制

在探讨增价拍卖之前,我们首先需要确认,对于单位需求竞标者和异质商品,是否至少存在一个直接显示的、占优策略激励相容的机制。

答案是肯定的,我们可以使用维克瑞-克拉克-格罗夫斯机制

首先,最大化社会福利问题本身与二分图最大权匹配问题等价。

  • 构建二分图:一侧是竞标者节点,另一侧是商品节点。
  • 边权重:连接竞标者 i 和商品 j 的边的权重即为估值 v_ij
  • 问题转化:在单位需求下,每个竞标者至多获得一件商品,每件商品也只能分配给一个竞标者。因此,最大化社会福利等价于在这个二分图中找到一个最大权匹配。

计算最大权二分图匹配有多项式时间算法(例如,通过线性规划或组合算法)。因此,社会福利最大化在计算上是可行的。

VCG机制利用了这一事实:

  1. 收集报价:竞标者报告其估值(假设是真实的)。
  2. 分配规则:计算基于报价的最大权二分图匹配,以此作为分配结果。
  3. 支付规则:向每个竞标者收取其外部性,即因其参与而导致其他竞标者总福利的减少量。

VCG机制是一个通用方案,能确保在占优策略下实现真实报价和社会福利最大化。在这个特定场景中,由于最大权匹配可高效计算,因此整个VCG机制可以在多项式时间内实现。这通过了我们的初步可行性检查。

增价拍卖的高层设计思路

既然直接显示机制是可行的,我们现在转向更具挑战性的目标:设计一个增价拍卖。我们之前见过的两种拍卖(英式拍卖和并行英式拍卖)都遵循一个共同模式:

  1. 将价格初始化为0。
  2. 提高价格,直到供给等于需求

我们希望将这种思路应用到场景三。

  • 供给:每件商品各有一单位。
  • 需求:在给定价格向量下,每个竞标者最想要的商品。具体来说,竞标者 i 在价格 p 下的需求是其能获得最大净效用(估值减价格)的商品:
    公式:Demand_i(p) = argmax_j (v_ij - p_j)
    如果所有净效用都为负,则需求为空集。

基于这个需求定义,我们可以判断市场状态:如果一件商品被多个竞标者视为“最爱”,则它供不应求,价格可能应该上涨;如果一件商品无人问津,则它供过于求

我们期望的增价拍卖将遵循这个高层逻辑:调整价格,直至每件商品最多只有一个竞标者将其视为最爱,且未售出商品的价格为0。

连接VCG与增价拍卖:瓦尔拉斯均衡

我们为增价拍卖设定了一个更强的目标:真实报价应引导拍卖终止于VCG机制的结果(包括分配和支付价格)。这不仅仅是达到最大社会福利,而是要精确复制VCG的结果。

这带来了一个关键挑战:VCG支付价格的计算看似复杂(涉及计算有/无某个竞标者时的匹配差值),而简单的增价拍卖过程似乎难以直接计算出如此复杂的价格。

为了解决这个挑战,我们引入瓦尔拉斯均衡的概念。对于单位需求场景,其定义如下:

一个瓦尔拉斯均衡 是一个价格向量 p 和一个匹配 M 的组合,满足以下两个条件:

  1. 个体理性:每个竞标者都获得其在该价格下最想要的商品(即最大化其净效用的商品)。如果所有净效用为负,则竞标者什么也得不到。
  2. 市场出清:任何未售出的商品,其价格必须为0。

解读:瓦尔拉斯均衡价格具有“市场出清”的魔力。如果将这些价格标签贴在商品上,让每个竞标者独立地选择自己最想要的商品,那么恰好不会有冲突(即没有商品被超过一个人选择),并且未售出的商品本来就是免费品。这正是一个分散化市场达到稳定状态的表现。

为什么相关? 回顾我们的增价拍卖高层设计:它通过调整价格使供给等于需求,而这正是达到瓦尔拉斯均衡的过程。因此,瓦尔拉斯均衡是我们设计的增价拍卖的自然终止点。

第一福利定理与瓦尔拉斯均衡

瓦尔拉斯均衡有一个非常重要的性质,由第一福利定理描述:

定理:在任何瓦尔拉斯均衡中,对应的匹配 M 必定是最大化社会福利的匹配。

证明思路

  1. (p, M) 是一个瓦尔拉斯均衡,M* 是某个最大社会福利匹配。
  2. 根据均衡条件1,每个竞标者在匹配 M 中获得的效用(估值减支付)不低于其在匹配 M* 中可能获得的效用。
  3. 对所有这些不等式求和。左边求和得到匹配 M 的总社会福利减去所有售出商品的价格总和。
  4. 根据均衡条件2,所有未售出商品价格为0,因此所有商品价格总和等于售出商品价格总和。
  5. 右边求和得到匹配 M* 的总社会福利减去 M* 中商品的价格总和(该总和不超过所有商品价格总和)。
  6. 整理不等式,可推出匹配 M 的社会福利不低于 M* 的社会福利,故 M 也是最大社会福利匹配。

这个定理建立了瓦尔拉斯均衡与效率(社会福利最大化)之间的联系,这与VCG机制的目标一致。

VCG支付是最小瓦尔拉斯均衡价格

我们现在建立VCG支付与瓦尔拉斯均衡价格之间的核心联系。首先是一个引理:

混合匹配引理:如果 (M1, p1)(M2, p2) 都是针对某组估值的瓦尔拉斯均衡,那么 (M1, p2)(M2, p1) 也都是瓦尔拉斯均衡。

基于此,我们可以证明一个重要定理:

定理:令 p^VCG 是由VCG结果导出的商品价格向量(即每件商品的售价等于其赢家的VCG支付,未售出商品价格为0)。那么,对于任何瓦尔拉斯均衡价格向量 p,都有 p^VCG_j ≤ p_j 对所有商品 j 成立。

证明思路

  1. 考虑任意瓦尔拉斯均衡价格向量 p 和VCG分配匹配 M。根据混合匹配引理,(M, p) 也是一个瓦尔拉斯均衡。
  2. 固定一件在VCG中售出的商品 j,其赢家是竞标者 i
  3. VCG支付 p^VCG_j 等于竞标者 i 的外部性,即“仅针对其他竞标者优化”与“针对所有竞标者优化时其他竞标者的福利”之差。
  4. 对除 i 外的所有竞标者,应用均衡条件 (M, p):每个竞标者 kM 中获得的效用不低于其获得“删除 i 后的最优匹配 M^{-i}”中对应商品时的效用。
  5. 对这些不等式求和。左边求和得到其他竞标者在 M 中的总福利减去除商品 j 外所有商品的价格总和(因为 i 得到了 j)。右边求和得到其他竞标者在 M^{-i} 中的总福利减去 M^{-i} 中商品的价格总和(该总和不超过所有商品价格总和)。
  6. 整理不等式,即可得到 p_j ≥ p^VCG_j

这个定理表明,VCG支付价格不高于任何瓦尔拉斯均衡价格。

关键引理与最终定理

为了证明VCG价格本身构成一个瓦尔拉斯均衡,我们需要一个关键引理:

关键引理:对于VCG结果中的任何商品 j,其VCG支付价格 p^VCG_j 恰好等于添加一件商品 j 的复制品后,社会福利的最大增加值

直观理解:如果竞标者 i 在商品 j 稀缺(仅一件)时赢得了它,那么当商品 j 变得充裕(有两件)时,i 应该仍然能获得其中一件。这个引理的形式化证明需要一些技巧,但其结论非常直观且强大。

利用这个关键引理,我们可以证明最终的定理:

定理:由VCG机制产生的分配和支付价格 (M, p^VCG) 构成一个瓦尔拉斯均衡,并且是最小的瓦尔拉斯均衡(即任何其他瓦尔拉斯均衡价格都分量不低于它)。

证明思路(利用关键引理)

  1. 我们只需验证瓦尔拉斯均衡的条件1,因为条件2(未售出商品价格为0)由VCG定义满足。
  2. 考虑VCG中赢得商品 j 的竞标者 i,以及任何其他商品 l
  3. 我们需要证明 i 在价格 p^VCG 下更喜欢 j 而不是 l,即 v_ij - p^VCG_j ≥ v_il - p^VCG_l
  4. 根据关键引理,p^VCG_l 等于添加商品 l 的复制品带来的社会福利增益。我们可以构造一个特定的方案来利用这个复制品:将 i 重新分配给 l 的复制品,然后为其他竞标者重新优化分配(现在商品 j 被释放出来了)。
  5. 这个方案带来的社会福利增益至少是:(v_il - v_ij) + [其他竞标者在重新优化后的福利 - 其他竞标者在原VCG中的福利]
  6. 方括号内的差值正是竞标者 i 的VCG支付,即 p^VCG_j(同样由关键引理,VCG支付等于添加所赢商品复制品带来的福利增益)。
  7. 因此,p^VCG_l ≥ (v_il - v_ij) + p^VCG_j,整理后即得 v_ij - p^VCG_j ≥ v_il - p^VCG_l。这验证了条件1。

结合之前的定理(VCG价格不高于任何均衡价格)和本定理(VCG价格本身是均衡价格),我们得出结论:VCG支付价格正是最小的瓦尔拉斯均衡价格。

总结与下节预告

本节课中,我们一起学习了为异质商品和单位需求竞标者设计机制的基础。我们首先确认了VCG机制在此场景下的可行性。然后,我们引入了瓦尔拉斯均衡这一市场出清价格的概念,并证明了第一福利定理,即瓦尔拉斯均衡必然导致有效分配。

最重要的是,我们建立了VCG机制与瓦尔拉斯均衡之间的深刻联系:

  1. VCG支付价格不高于任何瓦尔拉斯均衡价格。
  2. VCG支付价格本身构成一个瓦尔拉斯均衡,并且是最小的那个。

这个结论至关重要。它将看似复杂的VCG支付计算,转化为寻找“最小市场出清价格”这一更直观、更可能通过增价拍卖实现的目标。

在下节课中,我们将利用这一认识,最终构建出一个增价拍卖。该拍卖通过逐步调整价格,能够保证在真实报价下收敛到最小的瓦尔拉斯均衡,从而模拟出VCG机制的结果。我们将完成这个机制设计拼图的最后一块。

003:Crawford-Knoer拍卖

在本节课中,我们将学习一种用于非相同物品和单位需求竞拍者的升价拍卖——Crawford-Knoer拍卖。我们将详细分析其设计、运行过程,并证明它在真诚出价下能够模拟VCG机制的结果,同时是事后激励相容的。


课程概述与提醒

首先,提醒一下课程安排。本课程的主要交付成果是一个项目。我预计在课程的第四周左右开始发布项目主题。我非常欢迎大家提出自己的项目想法。

此外,由于课程视频会上传到YouTube,我需要获得大家的肖像权许可。如果你不同意出镜,请坐在教室中镜头之外的位置。


回顾:升价拍卖的设计场景

上一周我们讨论了升价拍卖的理论。课程的前三周将围绕为日益复杂的场景设计升价拍卖展开。每个场景都揭示了设计中的新一层复杂性。

  • 场景一:单位需求竞拍者和相同物品。解决方案简单:使用单一升价拍卖。
  • 场景二:非相同物品,但增加了估值。解决方案也简单:使用并行升价拍卖,但我们需要引入事后激励相容性。
  • 场景三:我们当前所处的场景,即非相同物品和单位需求竞拍者。

场景三的好消息是我们可以得到非常积极的正面结果。坏消息(或者说特点)是,即使解决方案简单,理解其为何有效也相当复杂。


场景三的核心设定与目标

在场景三中,我们假设竞拍者是单位需求的。这意味着如果给一个竞拍者多个物品,他只会保留最喜欢的那一个。因此,我们可以将分配视为一个匹配问题。

我们的目标是设计一个拍卖,它需要满足:

  1. 事后激励相容性:真诚出价是事后纳什均衡。
  2. 最大化社会福利:模拟VCG机制的直接显示结果。
  3. 计算简单:至少是多项式时间可计算的。

上一讲的难点在于,VCG支付看起来是两种不同匹配的差值,而我们限制自己使用简单的升价拍卖。上一讲的成果是用瓦尔拉斯均衡来更简单地刻画VCG支付。


瓦尔拉斯均衡与VCG支付的关联

让我们回顾一下关键结果。一个价格向量 Q 和一个匹配 M 构成一个瓦尔拉斯均衡,当且仅当:

  1. 每个竞拍者都获得其最偏好的物品(即效用 v_i(j) - Q_j 最大化)。
  2. 未售出物品的价格为 0

上一讲证明的关键结果是:

  1. VCG结果(分配和支付)构成一个瓦尔拉斯均衡。
  2. 在所有可能的瓦尔拉斯均衡价格向量中,VCG支付是最小的(按分量比较)。

因此,我们的目标从直接计算VCG支付,转变为计算最小的瓦尔拉斯均衡价格。这看起来更像是升价拍卖的停止条件所能达到的状态。


Crawford-Knoer拍卖算法介绍

现在,我们介绍Crawford-Knoer拍卖算法。其直觉是:从零价格开始,对过度需求的物品提高价格,希望最终供需平衡。

以下是算法的详细步骤:

初始化

  • 所有物品价格 Q_j = 0
  • 所有竞拍者标记为“未分配”。

主循环

  1. 询问每个未分配的竞拍者 i,在当前价格向量 Q(每个分量加上一个极小增量 ε)下,他们最想要的物品是什么(即需求集 D_i(Q+ε))。如果所有物品的效用都为负,则报告“无需求”。
  2. 停止条件:如果没有未分配的竞拍者,或者所有未分配的竞拍者都报告“无需求”,则停止。当前的临时分配和价格成为最终结果。
  3. 出价与分配:否则,选择一个未分配的竞拍者 i 及其报告的一个需求物品 j
    • 将物品 j 临时分配给竞拍者 i
    • 如果物品 j 之前有临时持有者 i',则:
      • i' 标记为“未分配”。
      • 将物品 j 的价格提高 εQ_j = Q_j + ε
    • 如果 j 之前无人竞标,则价格保持为0。

终止:竞拍者支付终止时的价格 Q

这个算法非常简单。其复杂性全部分析中,而非算法本身。


初步观察与引理一:近似瓦尔拉斯均衡

首先,我们做一些初步观察:

  • 一旦竞拍者对某物品出价,该物品将始终被临时分配给某人。
  • 在真诚出价下,拍卖必然终止(价格不会无限上涨)。

引理一(真诚出价导致近似WE):在真诚出价下,Crawford-Knoer拍卖的结果是一个 ε-近似瓦尔拉斯均衡。这意味着:

  • 未售出物品价格为0。
  • 每个竞拍者获得的物品,其效用至少不低于其他任何物品的效用减去 ε

证明思路

  1. 未售出物品价格为0:根据算法,只有从未被出价过的物品才会未售出,其价格始终为0。
  2. 竞拍者获得近似最偏好物品:考虑竞拍者 i 最终获得物品 j。回顾 i 最后一次被询问并选择 j 的时刻。那时,ji 在(加 ε 后的)价格下的(近似)最偏好物品。此后,直到拍卖结束:
    • 物品 j 的价格未变(因为 i 是最终赢家)。
    • 其他物品的价格只升不降。
      因此,j 始终是 i 的(近似)最偏好物品。

由于结果是近似瓦尔拉斯均衡,根据习题结论,它必然导致近似最大社会福利(至多损失 M * ε)。


引理二:价格不高于VCG支付

我们已证明拍卖结果是一个近似WE。但我们想要的是最小的那个WE(即VCG支付)。引理二将证明拍卖结果的价格不会显著高于VCG支付。

引理二:设拍卖的最终结果为 (Q, M),VCG结果为 (P*, M*)。那么,对于所有物品 j,有 Q_j ≤ P*_j + ε * L,其中 L 是一个与交易数量相关的常数(不超过 min(n, m))。

证明思路(归纳构造)
我们采用反证法。假设存在某个物品 j1 的价格 Q_{j1} 显著高于其VCG价格 P*_{j1}(高出 ε * L)。我们将通过归纳构造一组竞拍者和物品集合来导出矛盾。

归纳构造:假设存在一个即将对高价物品 j1 出价的竞拍者 i1。我们可以构造嵌套的集合对 (U_k, B_k),其中 U_kk 个物品的集合,B_kk+1 个竞拍者的集合,满足:

  1. U_k 中所有物品的价格都显著高于其VCG价格。
  2. B_k 中所有竞拍者最近一次出价都是针对 U_k 中的某个物品。
  3. B_k 中所有竞拍者在VCG结果 M* 中都被分配了物品。

基例 (k=1)

  • U_1 = {j1}
  • B_1 = {i1, i2},其中 i2j1 当前的临时持有者。
  • 性质1由假设满足。性质2显然。性质3成立,因为 i1i2j1 的估值都高于其VCG价格,因此在VCG均衡中他们不可能未被分配(否则效用为负)。

归纳步骤
假设已构造好 (U_{k-1}, B_{k-1})

  1. 找到新物品:由于 B_{k-1}k 个竞拍者,且在 M* 中都被分配,而 U_{k-1} 只有 k-1 个物品,根据鸽巢原理,存在一个竞拍者 i ∈ B_{k-1}M* 中被分配到 U_{k-1} 之外的物品 j_k。我们可以证明 j_k 的价格也足够高(利用 i 上次选择了 U_{k-1} 中的物品而非 j_k 的事实,结合价格变化和WE条件)。将 j_k 加入得到 U_k
  2. 找到新竞拍者:由于 j_k 价格为正,它有一个当前的临时持有者 i_{k+1}i_{k+1} 不在 B_{k-1} 中(因为 B_{k-1} 中竞拍者最近都出价 U_{k-1} 中的物品)。将 i_{k+1} 加入得到 B_k。同理可证 i_{k+1}M* 中被分配。

矛盾:这样我们构造出了 B_L,包含 L+1 个竞拍者,且都在 M* 中被分配。但 M* 中最多只有 min(n, m) 个竞拍者被分配。因此,L 不能太大,最初假设的“价格显著高于VCG价格”不成立。

此引理表明,拍卖结果的价格不会显著高于最小的WE(即VCG支付)。


激励相容性分析

以上所有分析都假设竞拍者真诚出价。现在我们需要论证,真诚出价是否是竞拍者的最优策略,即拍卖是否是事后激励相容的。

首先,我们区分两种偏离策略:

  • 一致行动:竞拍者假装拥有另一个估值 v',然后根据 v' 真诚出价。存在某个估值能解释其所有行为。
  • 不一致行动:竞拍者的行为无法用任何单一估值下的真诚出价来解释(例如,根据历史行动进行条件性出价)。

从模拟VCG得到的基本性质:如果一个拍卖在真诚出价下模拟了VCG结果,那么当其他竞拍者真诚出价时,任何一致行动的偏离都不会让偏离者获益。这是因为一致行动对应于在直接VCG机制中报告一个虚假估值 v',而VCG是占优策略激励相容的。

然而,这弱于事后激励相容性。事后激励相容性要求,即使考虑所有可能的不一致行动,真诚出价仍然是最优反应。

定理(CK拍卖是近似EPIC):Crawford-Knoer拍卖是近似事后激励相容的。

证明思路

  1. 固定一个考虑任意偏离(可能不一致)的竞拍者 i,假设其他竞拍者真诚出价。
  2. i 通过其偏离策略最终获得了物品 j(否则效用为0)。
  3. 构造一个虚拟估值 v'_i:对物品 j 的估值设为极高(如无穷大),对其他物品估值设为0。
  4. 关键主张:无论 i 采取何种偏离策略,拍卖的最终结果 (Q, M) 都是关于估值剖面 (v'_i, v_{-i}) 的一个 ε-近似瓦尔拉斯均衡
    • 理由:i 获得了 j(在 v'_i 下显然是其最偏好物品)。其他竞拍者因为真诚出价,根据算法终止条件,依然获得其近似最偏好物品。未售出物品价格为0。
  5. 根据一个补充性的引理三(其证明与引理二类似,在习题中):任何 ε-近似WE 的价格都不会显著低于对应估值剖面下的VCG支付。因此,Q 不会比 v'_i 对应的VCG支付低太多。
  6. 因此,i 通过不一致偏离获得 j 所支付的 Q_j,至少接近于他如果假装估值是 v'_i 并一致行动时所需支付的价格。而我们已经知道,一致行动不会比真诚出价(报告真实 v_i)带来更高收益。
  7. 综上,即使是不一致行动,也不会让竞拍者获得比真诚出价显著更高的效用。

总结

本节课中,我们一起学习了Crawford-Knoer拍卖:

  1. 算法设计:我们从零价格开始,让未分配的竞拍者对物品出价,对发生竞争的物品进行小幅提价,直到供需平衡。
  2. 均衡性质:我们证明了在真诚出价下,该拍卖会终止于一个近似瓦尔拉斯均衡,从而获得近似最大社会福利。
  3. 价格关联:通过细致的归纳论证,我们证明了拍卖结果的价格不会高于(引理二),也不会显著低于(引理三)VCG支付,即它近似于最小的瓦尔拉斯均衡。
  4. 激励相容性:我们进一步论证了,不仅一致行动的偏离无效,即使竞拍者采取任意复杂的不一致行动,也无法获得比真诚出价更好的结果,从而证明了该拍卖是近似事后激励相容的。

Crawford-Knoer拍卖为具有单位需求的竞拍者和非相同物品的场景,提供了一个简单、高效且激励相容的升价拍卖解决方案。

004:克劳奇拍卖(The Clinching Auction)

在本节课中,我们将学习一种适用于多单位拍卖场景的上升拍卖机制——克劳奇拍卖。我们将看到,尽管无法通过瓦尔拉斯均衡来实现维克瑞-克拉克-格罗夫斯(VCG)结果,但克劳奇拍卖能够以迭代和激励兼容的方式有效地模拟VCG机制。

上一节我们讨论了单位需求场景下的挑战,本节中我们来看看当竞拍者可以需求多个单位时的情况。

场景设定与目标

我们考虑一个多单位拍卖场景,其中有 M 个完全相同的商品。每个竞拍者 i 对第 j 个商品的边际估值(即获得第 j 个商品,假设已拥有 j-1 个)为 v_i(j)。这些估值是私人信息。

我们假设估值是向下倾斜的,即对于每个竞拍者 i,其边际估值序列是非递增的:
v_i(1) ≥ v_i(2) ≥ v_i(3) ≥ ...

我们的目标是设计一个上升拍卖,使其具备激励兼容性(EPIC),并能最大化社会福利(即总剩余)。

VCG机制回顾

作为基准,我们首先回顾直接显示机制中的VCG机制。在VCG机制中:

  1. 分配规则:根据竞拍者报告的估值(假设为真实估值 b_i(j)),通过贪心算法分配商品。具体来说,将所有报告的边际估值 b_i(j) 从高到低排序,将商品分配给前 M 个最高的边际估值。
  2. 支付规则:每个获胜的竞拍者 i 支付其存在给其他竞拍者带来的外部性。

然而,在这个多单位场景中,VCG结果不一定对应一个瓦尔拉斯均衡。这意味着我们无法像在单位需求场景中那样,简单地通过寻找最小的瓦尔拉斯均衡价格来实现VCG。

VCG支付的价格表解释

为了构建上升拍卖,我们需要更结构化地理解VCG支付。对于获得 x_i 个商品的竞拍者 i,其VCG支付可以理解为按单位支付一系列递增的价格。

具体来说,竞拍者 i 为其获得的第 j 个商品支付的价格 P_i(j) 定义为:其他所有竞拍者边际估值中,第 (M - j + 1) 高的那个值。这可以等价地表述为:

P_i(j) = inf { Q | 所有其他竞拍者在价格 Q 下的总需求 ≤ M - j }

其中,竞拍者 k 在价格 Q 下的需求 D_k(Q) 是其边际估值超过 Q 的商品数量:D_k(Q) = max { j | v_k(j) > Q }

这个解释非常关键。它意味着VCG机制为每个竞拍者 i 设定了一个个人化的、递增的价格表。竞拍者 i 获得商品直到其边际估值低于下一个商品的价格。

克劳奇拍卖机制

基于上述理解,我们现在可以描述克劳奇拍卖的流程。其核心思想是逐步提高统一的价格 P,并在价格提升的间隙,根据当前的需求和供给情况“敲定”(clinch)商品的分配。

以下是拍卖步骤:

  1. 初始化:设置当前价格 P = 0
  2. 查询需求:在每个价格 P(或其离散化增量,如 P+ε),询问每个竞拍者 i 在该价格下的需求数量 D_i(P)
  3. 终止条件:持续提高价格 P,直到所有竞拍者的总需求 Σ_i D_i(P) 首次小于或等于商品总数 M。记此时的价格为 P_final,上一轮(价格略低时)的价格为 P_penultimate
  4. 最终分配
    • 每个竞拍者 i 至少获得 D_i(P_final) 个商品。
    • 每个竞拍者 i 至多获得 D_i(P_penultimate) 个商品。
    • 在所有竞拍者之间分配全部 M 个商品,使其满足上述约束。具体的分配方式在满足约束下可以任意(例如,在简单情况下,当总需求恰好等于 M 时,分配是唯一的)。
  5. 最终支付:对于竞拍者 i 获得的第 j 个商品,其支付价格为:
    Q_i(j) = min { Q | 所有其他竞拍者在价格 Q 下的总需求 ≤ M - j } - ε
    其中 Q 取拍卖过程中实际查询过的价格点(即 P 的离散值)。这个价格本质上近似于之前定义的 P_i(j)

机制分析(假设真诚出价)

首先,我们假设所有竞拍者都遵循“真诚出价”策略,即在每个被询问的价格 P 下,如实报告自己的需求 D_i(P)

以下是拍卖的性质:

  • 近似最优分配:克劳奇拍卖实现的福利与VCG机制的最大可能福利相差不超过 M * ε。这是因为最终分配的商品集合,其边际估值都高于 P_final,而未分配的高估值商品其价值也介于 P_penultimateP_final 之间,误差可控。
  • 近似VCG效用:对于每个竞拍者 i,其在克劳奇拍卖中获得的效用(估值减去支付)与其在VCG机制中获得的效用相差不超过 2M * ε。这是因为拍卖为竞拍者 i 设定的个人化价格表 Q_i(j) 与VCG价格表 P_i(j) 非常接近(至多差 ε),并且分配的商品数量也近似于在该价格表下的最优数量。

激励兼容性证明

克劳奇拍卖是事后激励兼容(EPIC)的。证明思路如下:

  1. 固定其他竞拍者的策略为“真诚出价”。这意味着其他竞拍者的行为(即他们的需求响应)完全由他们自己的估值决定,而不受竞拍者 i 行为的影响。
  2. 在此前提下,竞拍者 i 面临的个人化价格表 Q_i(j) 完全独立于 i 自己的行为。无论 i 如何应答需求查询,其他竞拍者的需求响应序列是固定的,从而决定了 i 的支付价格表。
  3. 给定这个固定的、不受 i 影响的支付价格表,竞拍者 i 面临的问题简化为:选择购买多少单位商品,其中第 j 单位的成本固定为 Q_i(j)
  4. 克劳奇拍卖的规则(在真诚出价假设下分析)恰恰会为竞拍者 i 实施近似最优的购买决策:购买商品直到边际估值低于下一单位的价格。
  5. 因此,对于竞拍者 i 来说,遵循“真诚出价”策略是一个 ε-最优反应(最优性误差在 ε 量级)。由于 ε 可以任意小,这实质上实现了占优策略激励兼容。

总结

本节课中我们一起学习了克劳奇拍卖机制。我们首先明确了在多单位、向下倾斜估值场景中,VCG结果与瓦尔拉斯均衡的不匹配性。接着,我们通过将VCG支付重新解释为个人化的递增价格表,为构建迭代机制奠定了基础。克劳奇拍卖通过逐步提高价格、查询需求并在需求与供给平衡时敲定交易,巧妙地模拟了VCG机制。分析表明,在真诚出价假设下,该拍卖能实现近似最优的福利分配和竞拍者效用。最重要的是,由于竞拍者无法通过策略性行为影响其面临的价格表,真诚出价构成了一个近似占优策略,从而使该拍卖具备事后激励兼容性。这为我们提供了一种在更一般的需求场景下,仍能保持强激励属性和计算可行性的强大拍卖工具。

005:总替代条件(第一部分)

在本节课中,我们将学习一个被称为“总替代”的估值条件。这个条件统一了我们之前讨论过的几个可处理特例,并代表了在许多意义上可计算性的前沿。我们将从一个具体拍卖的推广开始,自然地引出总替代的定义,并探讨其核心性质。


课程概述与公告

练习二今天截止。练习三将于今晚发布,内容会有所精简,大约只有五到六道题。随着项目工作的展开,后续练习集可能会更短或取消。

关于课程项目,我已整理了一个包含许多想法的列表,稍后会发布到网页上。考虑到项目课程的一个特点是,你们通常只在学习了课程的一小部分内容后就需要确定项目主题,因此我在此概述本季度我们将涵盖的内容。

本课程大部分时间将研究一个范式问题:如何将物品分配给人们以最大化社会福利。通过这个问题的视角,我们可以覆盖机制设计领域近期工作的主要趋势。

我们从具有许多积极结果的可处理特例开始学习,在这些案例中,VCG机制是“显而易见”的直接显示解决方案,但我们更关注升价拍卖等更具雄心的目标。

从下周开始,我们将转向更一般的偏好设定,此时即使实现VCG机制也可能是计算困难的。我们将讨论针对这些NP难问题的积极和负面结果。这些负面结果将促使我们超越占优策略实施。

因此,我们将研究更弱的均衡概念,例如无劣势策略和贝叶斯纳什均衡。对于后者,在共同先验和贝叶斯纳什均衡的设定下,我们将获得一些非常好的积极结果。

之后,我们将回归对简单、实用拍卖的追求,探讨在多大程度上可以获得接近最优的福利。这部分分析将非常类似于上学期间关于“无政府状态价格”的章节。

最后,如果有剩余时间,我们将讨论收入最大化问题。与福利最大化不同,收入最大化甚至没有类似VCG机制的理论解决方案,尤其是在多参数设定下,这是一个极其困难但近年来有新进展的领域。

本课程的第一个主题是唯一具有经典性的部分,其余四个主题都将是21世纪,甚至是近三年的研究成果。项目列表将按这些主题分类。由于班级规模较小,我可以为你们的项目提供更多帮助,无论是在选题还是在整个季度中,都欢迎随时与我讨论。


回顾与引入

到目前为止,我们已经研究了四个可处理的特殊案例。
前两个案例相对简单:同质物品与单位需求(对应英式拍卖),以及可加性估值(对应并行英式拍卖)。
我们还研究了两个不那么简单但结果令人满意的案例:非同质物品与单位需求竞拍者(使用Crawford-Knoer拍卖实现福利最大化),以及同质物品与边际递减估值(使用Ausubel的锁定拍卖)。

后两个积极的解决方案看起来并不十分相似。然而,事实证明,存在一个对这两个场景的共同推广,它代表了我们在许多意义上可处理性的前沿。这就是我们今天要讨论的“总替代”估值。


推广Crawford-Knoer拍卖

我们首先从Crawford-Knoer拍卖开始,并研究其自然推广,即允许竞拍者同时需要多个物品的情况。然后,我们将探讨这个拍卖在什么条件下可能良好运作,从而自然地引出总替代估值的定义。

一般设定

设有 M 个物品,这些物品在一般情况下非同质。竞拍者 i 对任何可能获得的物品组合(称为“捆绑包”) K 有一个私人的估值或支付意愿 v_i(K)。这是一个非常一般的模型,包含了我们目前见过的所有四种情况。从下周开始,我们也会看到它包含了一些非常困难的版本。

除非另有说明,我们总是假设对空集的估值为0,并且更多的物品不会降低估值,即估值是单调的(也称为“自由处置权”)。这意味着对于任意集合 S 和 T,有 v_i(S ∪ T) ≥ v_i(S)。

需求集定义

在Crawford-Knoer拍卖的主要迭代中,我们会询问尚未分配到物品的竞拍者,在当前价格下他们最喜欢的物品是什么。现在,竞拍者可能想要多个物品。因此,我们形式化定义竞拍者 i 在价格向量 Q 下的需求集 D_i(Q):

D_i(Q) = argmax_{S ⊆ M} [ v_i(S) - Σ_{j∈S} Q_j ]

竞拍者可以选择需求空集,此时支付为0。

Kelso-Crawford 拍卖

这是Crawford-Knoer拍卖的推广,由Kelso和Crawford提出,他们也是我们今天使用的总替代定义的首创者。

拍卖过程如下:

  • 价格从零开始,只会上涨。
  • 同时,我们记录当前分配给每位竞拍者的物品集合 S_i,初始为空。

在主循环中:

  1. 我们询问每位竞拍者 i,在给定其已拥有物品 S_i 且不能丢弃它们的前提下,他们还希望按当前价格额外竞标哪些物品。更精确地说,竞拍者报告一个集合 T,该集合是其以下优化问题的解:
    T ∈ argmax_{T ⊆ M \ S_i} [ v_i(S_i ∪ T) - Σ_{j∈S_i} Q_j - Σ_{j∈T} (Q_j + ε) ]
    
    注意,对于已拥有的物品,支付当前价格 Q_j;对于新竞标的物品,则视为价格是 Q_j + ε。
  2. 如果没有人想要更多物品,则拍卖停止。当前分配(每位竞拍者获得其集合 S_i)和价格即为结果。
  3. 否则,任意选择一位想要更多物品的竞拍者 i 及其报告的集合 T_i。
  4. 将集合 T_i 中的物品分配给竞拍者 i。这意味着从这些物品的前任所有者手中拿走它们。
  5. 对于被拿走的每个物品 j,如果它之前有所有者(即不是第一次被竞标),则将其价格增加 ε。

如果所有竞拍者都是单位需求的,这个拍卖就精确地简化为Crawford-Knoer拍卖。


一个反面例子

以下是一个简单的例子,说明如果竞拍者真诚出价,这个拍卖可能完全失败。

假设有两个物品和两位竞拍者:

  • 竞拍者1是“全有或全无”型(或称单一需求型),只有同时获得两个物品时估值 v_1({1,2}) = 3,否则估值为0。
  • 竞拍者2是单位需求型,对任何非空集合的估值都是2,即只想要一个物品,且不关心是哪一个。

如果竞拍者真诚出价,拍卖可能会陷入循环:竞拍者1同时竞标两个物品,竞拍者2出价抢走其中一个,竞拍者1又出价抢回,如此反复。价格会不断上涨。当两个物品价格都达到1.5时,竞拍者1获得两个物品的效用变为0。但竞拍者2仍会出价抢走一个物品。此时,竞拍者1虽然持有另一个物品的效用为负,但为了减少损失,可能仍会出价抢回第一个物品。最终,竞拍者1可能以总价4获得两个物品,效用为-1。

这个例子表明,真诚出价不构成均衡。更重要的是,在最终状态,竞拍者1并没有获得在当前价格下的需求集(它宁愿什么都不要)。这引出了一个问题:为了使Kelso-Crawford拍卖良好运作,我们需要对估值施加什么条件?


总替代条件的定义

在反面例子中,一个明显的“危险信号”是拍卖进行到某个点时,竞拍者实际上希望放弃一个已获得的物品,但拍卖规则不允许。在单位需求案例中,这种情况不会发生:一旦你获得一个物品,即使其他价格上涨,你仍然乐意持有它。这似乎是单位需求案例与一般案例之间的重要区别。

总替代估值条件的定义正是为了确保:在一个升价拍卖(特别是Kelso-Crawford拍卖)中,竞拍者永远不会想要放弃之前以某个价格获得的物品。

形式化定义如下:
一个估值函数 v_i 满足总替代条件,如果对于任意两个价格向量 P 和 Q,其中 Q 的每个分量都大于等于 P 的对应分量(即 Q ≥ P),并且对于任意在价格 P 下的需求捆绑包 S ∈ D_i(P),以及任意价格严格上涨的物品集合 A ⊆ { j ∈ S | Q_j > P_j },都存在一个在价格 Q 下的需求捆绑包 T ∈ D_i(Q),使得 S \ A ⊆ T。

换句话说,考虑拍卖的早期时刻(价格 P)和后期时刻(价格 Q ≥ P)。如果你在早期时刻想要物品集合 S,那么到了后期,对于那些价格没有上涨的物品(即 S 中不在 A 里的部分),你仍然“想要”它们,即存在一个在更高价格 Q 下的最优捆绑包包含所有这些物品。

这个定义的核心思想是,你不想放弃之前以未变价格获得的物品。


例子与非例子

非例子:前面的“全有或全无”型竞拍者违反了总替代条件。假设价格 P=(1,1),此时竞拍者需求两个物品。将第一个物品的价格提高到 Q=(3,1),此时竞拍者的需求变为空集。价格上涨的物品集合 A 只包含第一个物品,但竞拍者连第二个物品(其价格未变)也放弃了,这违反了定义。

例子:我们目前见过的所有案例都满足总替代条件。

  • 可加性估值:物品间无交互,需求独立决定。
  • 单位需求:我们之前在证明Crawford-Knoer拍卖收敛时,本质上已证明了此性质。
  • 同质物品与边际递减估值:这也满足总替代条件。直观上,拿走一些物品会使你手中剩余的物品边际价值更高,因此你更想保留它们。
  • k-单位需求:这是单位需求的推广,即从获得的物品中挑选价值最高的最多 k 个。这也满足总替代条件。

因此,总替代条件统一了我们讨论过的后两个场景(非同质物品单位需求、同质物品边际递减),并构成了可处理性的前沿。


定理:总替代保证收敛

我们现在来证明,总替代条件是保证Kelso-Crawford拍卖良好运作(即收敛到一个近似瓦尔拉斯均衡)的充分条件。

定理:假设所有竞拍者的估值都满足总替代条件,并且他们真诚出价。那么,Kelso-Crawford拍卖会收敛到一个 Mε-近似瓦尔拉斯均衡,其中 ε 是价格增量。

证明概要

  1. 未售出物品价格为零:拍卖规则确保只有从未被出价过的物品价格才为零,这不需要总替代条件。
  2. 关键不变式:我们证明在拍卖的每一时刻,对每位竞拍者 i,其当前持有的物品集合 S_i 都包含于其在当前“ε-调整价格” Q_ε 下的某个需求捆绑包中。这里,Q_ε 对已持有物品使用当前价格,对未持有物品视为价格高出 ε。
    • 基础情况:初始时 S_i 为空,显然成立。
    • 归纳步骤
      • 如果竞拍者 i 刚刚出价,那么根据其选择,S_i 就是其在 Q_ε 下的一个需求捆绑包。
      • 如果其他竞拍者刚刚从 i 手中拿走了部分物品,考虑 i 上次出价时的价格 P(低于或等于当前价格 Q)。根据归纳假设,当时存在一个需求捆绑包包含当时的 S_i^old。自那以后,只有被拿走的物品价格上涨了。根据总替代条件,对于当前价格 Q,存在一个需求捆绑包包含那些未被涨价(即未被拿走)的物品,也就是当前持有的 S_i。再考虑到 Q_ε 与 Q 的细微差别(对未持有物品加 ε),不变式仍然得以保持。
  3. 终止条件:当拍卖终止时,没有人想再添加任何物品。结合不变式,这意味着每位竞拍者当前持有的 S_i 正是其在 Q_ε 下的(精确)需求捆绑包。由于真实价格比 Q_ε 中对未持有物品的估计价格最多低 Mε,因此这是一个 Mε-近似瓦尔拉斯均衡。

这个证明验证了我们的定义:总替代条件正是为保证这个不变式而设计的。


总替代的重要性:均衡存在性

令 ε → 0,上述定理表明,当所有估值满足总替代条件时,存在一个精确的瓦尔拉斯均衡(即一组市场出清价格,使得每个人获得其需求捆绑包)。这是一个构造性证明。

相反,在不满足总替代条件的情况下,瓦尔拉斯均衡可能不存在。例如,在之前的反面例子中(一个单一需求竞拍者,一个单位需求竞拍者),就不存在瓦尔拉斯均衡。更一般地,有定理表明:如果一个估值函数不满足总替代条件,那么总可以构造一个包含该估值以及其他一些(满足总替代的)单位需求估值的场景,使得整个市场没有瓦尔拉斯均衡。

因此,总替代在某种意义上保证了瓦尔拉斯均衡存在的自然边界。如果你想得到一个保证均衡存在的估值类,并且该类包含所有单位需求估值(这是总替代的一个子类),那么你不能超越总替代条件。


关于激励的说明

一个合理的问题是:我们为什么关心瓦尔拉斯均衡?在单位需求案例中,它们至关重要,因为VCG支付对应最小的瓦尔拉斯均衡。然而,在总替代的更一般情况下(包括我们上节课讨论的边际递减多物品案例),VCG支付并不一定对应任何一个瓦尔拉斯均衡。

关键点在于:要得到一个既是事后激励兼容(EPIC)又是福利最大化的升价拍卖,真诚出价必须产生VCG结果(包括分配和支付)。原因有二:

  1. 显示原理:一个EPIC的拍卖对应一个占优策略激励兼容的直接显示机制。
  2. 支付唯一性:对于占优策略机制,在相同的分配规则下(且失败者支付为零的标准化下),支付规则是唯一确定的。因此,任何高效的EPIC机制都必须实现VCG支付。

这意味着,仅仅运行Kelso-Crawford拍卖(它可能得不到正确的VCG支付)并不能给我们一个EPIC机制。我们还需要确保支付正确。我们将在后续课程中讨论激励问题。


本节课总结

在本节课中,我们一起学习了:

  1. 通过推广Crawford-Knoer拍卖,引入了允许竞拍者需求多个物品的Kelso-Crawford拍卖。
  2. 通过一个反面例子,说明了需要对估值施加额外条件,该拍卖才能良好运作。
  3. 由此自然地引出了总替代估值条件的定义,该条件要求竞拍者不会想要放弃之前以未变价格获得的物品。
  4. 验证了之前学过的可加性、单位需求、边际递减多物品等案例都满足总替代条件。
  5. 证明了定理:如果所有竞拍者估值满足总替代条件并真诚出价,Kelso-Crawford拍卖将收敛到一个近似瓦尔拉斯均衡。
  6. 指出了总替代条件的重要性:它保证了瓦尔拉斯均衡的存在性,是均衡存在性的一个自然边界。
  7. 简要讨论了激励问题,指出要实现EPIC,拍卖必须模拟VCG支付,而Kelso-Crawford拍卖本身不满足这一点。

总替代条件是机制设计中一个非常核心的概念。在下节课中,我们将探讨总替代在另一个完全不同方面——VCG机制的可计算性——中,如何同样构成了可处理性的前沿。

006:总替代品下的多项式时间福利最大化

在本节课中,我们将要学习如何在总替代品估值下,实现多项式时间的福利最大化,从而能够高效地运行VCG机制。我们将从简单的单位需求竞拍者(即二分图匹配问题)入手,建立线性规划和对偶理论的基础,然后将其推广到总替代品估值的一般情况,并利用椭球算法等工具证明多项式时间可解性。

热身:单位需求竞拍者(二分图匹配)

上一节我们介绍了总替代品估值及其性质。本节中,我们来看看如何利用这些性质实现高效计算。首先,我们从一个简单且熟悉的问题开始:单位需求竞拍者,其福利最大化问题等价于二分图最大权匹配。

整数规划与线性规划松弛

以下是该问题的整数规划(IP)表述。我们为每个竞拍者 i 和物品 j 定义一个决策变量 x_ij,取值为0或1,表示物品 j 是否分配给竞拍者 i

目标函数(最大化福利):

Maximize Σ_i Σ_j v_ij * x_ij

约束条件:

  1. 每个物品最多分配给一个人:对于所有物品 jΣ_i x_ij ≤ 1
  2. 每个竞拍者最多获得一个物品(单位需求):对于所有竞拍者 iΣ_j x_ij ≤ 1
  3. 整数约束:对于所有 i, jx_ij ∈ {0, 1}

这个整数规划的可行解一一对应于二分图匹配,目标函数值即为匹配的权重(福利)。

为了后续分析,我们考虑其线性规划(LP)松弛,即去掉整数约束,改为 x_ij ≥ 0。线性规划可以在多项式时间内求解。

对偶线性规划与互补松弛条件

线性规划的对偶为我们提供了一种证明目标值上界的方法。对于上述匹配问题的对偶规划,我们为每个竞拍者 i 引入对偶变量 u_i(可解释为效用),为每个物品 j 引入对偶变量 p_j(可解释为价格)。

对偶规划(最小化上界):

Minimize Σ_i u_i + Σ_j p_j

约束条件:
对于所有竞拍者 i 和物品 ju_i + p_j ≥ v_ij,且 u_i, p_j ≥ 0

弱对偶性指出,任何原始可行解(分数匹配)的目标值都不超过任何对偶可行解的目标值。

互补松弛条件(CS)描述了何时原始解和对偶解能同时达到最优(即目标值相等)。对于匹配问题,互补松弛条件如下:

  • CS1: 对于所有 x_ij > 0 的边,有 u_i + p_j = v_ij
  • CS2: 对于所有 u_i > 0 的竞拍者,有 Σ_j x_ij = 1
  • CS3: 对于所有 p_j > 0 的物品,有 Σ_i x_ij = 1

强对偶性则保证,对于线性规划,总存在一对原始解和对偶解使得目标值相等,从而两者均为最优。

与瓦尔拉斯均衡的联系

一个关键的发现是,瓦尔拉斯均衡与最优对偶解之间存在直接对应关系。

定理: 对于单位需求竞拍者(二分图匹配),价格向量 p 和分配 M 构成一个瓦尔拉斯均衡,当且仅当 p 是某个最优对偶解的价格部分,且 M 对应的原始解是该线性规划(及其整数规划)的最优解。

证明思路:

  • (⇒)给定一个瓦尔拉斯均衡 (p, M),我们可以根据价格 p 定义对偶变量 u_i = max_j {v_ij - p_j, 0}。可以验证,这样构成的原始解(对应匹配 M)和对偶解 (u, p) 满足互补松弛条件,因此两者均为最优。
  • (⇐)给定一个最优原始整数解(对应匹配 M)和一个最优对偶解 (u, p),互补松弛条件恰好保证了 (p, M) 构成一个瓦尔拉斯均衡。

这个定理揭示了市场均衡价格与线性规划对偶变量之间的深刻联系。更重要的是,它指出瓦尔拉斯均衡的存在性等价于线性规划松弛的精确性(即整数规划的最优值等于其线性松弛的最优值)。在单位需求情况下,这总是成立。

推广到一般估值函数

现在,我们将上述框架推广到任意估值函数,而不仅仅是单位需求。

广义的整数规划与线性规划

对于具有一般估值 v_i(S) 的竞拍者,福利最大化的整数规划涉及变量 x_iS(表示竞拍者 i 是否获得物品集合 S)。

目标函数:

Maximize Σ_i Σ_S v_i(S) * x_iS

约束条件:

  1. 每个竞拍者最多获得一个物品包:对于所有竞拍者 iΣ_S x_iS ≤ 1
  2. 每个物品最多被分配一次:对于所有物品 jΣ_i Σ_{S: j∈S} x_iS ≤ 1
  3. 整数约束:x_iS ∈ {0, 1}

其线性规划松弛同样是将整数约束替换为 x_iS ≥ 0

相应的对偶规划为:

Minimize Σ_i u_i + Σ_j p_j

约束条件:
对于所有竞拍者 i 和物品集合 Su_i + Σ_{j∈S} p_j ≥ v_i(S),且 u_i, p_j ≥ 0

可以等价地写为:对于所有竞拍者 iu_i ≥ max_S { v_i(S) - Σ_{j∈S} p_j }

定理的广义形式与总替代品的关键作用

前述关于瓦尔拉斯均衡与线性规划精确性关系的定理,在完全相同的表述下也适用于这个一般化的设定。证明过程也完全相同。

然而,在一般情况下,瓦尔拉斯均衡可能不存在(例如,存在互补品时)。根据定理,这意味着线性规划松弛不精确(LP最优值严格大于IP最优值)。

这正是总替代品估值发挥作用的地方。我们已知(例如,通过Kelso-Crawford拍卖的极限论证),对于总替代品估值,瓦尔拉斯均衡总是存在。根据上述定理,我们立即得到以下重要推论:

推论: 对于总替代品估值,福利最大化问题的线性规划松弛是精确的。即,整数规划的最优值等于其线性规划松弛的最优值。

这个推论是后续设计多项式时间算法的基础:我们只需要解决线性规划问题,就能得到整数最优解。

多项式时间实现VCG机制

VCG机制需要计算福利最大化的分配以及相应的VCG支付。计算支付本质上需要解决 n+1 次福利最大化问题。因此,核心挑战在于设计一个多项式时间算法来解决福利最大化问题。

计算模型与查询类型

我们需要明确“多项式时间”的含义。由于估值函数可能非常复杂(显式列出需要 n * 2^m 个数值),我们采用黑箱查询模型:

  • 算法将每个估值函数 v_i(·) 视为一个黑箱。
  • 算法可以向黑箱提出特定类型的查询,每次查询计为一步操作。
  • 目标是总运行时间(常规计算步骤 + 查询次数)是竞拍者数量 n 和物品数量 m 的多项式。

两种最自然的查询是:

  1. 价值查询: 给定物品集合 S,返回 v_i(S)
  2. 需求查询: 给定物品价格向量 p,返回在价格 p 下使净效用 v_i(S) - Σ_{j∈S} p_j 最大化的一个物品集合 S(即需求集)。

需求查询在拍卖上下文中非常自然(询问竞拍者在给定价格下想要什么),并且通常比价值查询更强大。

主要定理与证明思路

定理: 对于总替代品估值,存在一种算法,使用多项式次(关于 nm)的需求查询和价值查询,计算出福利最大化的分配,从而可以在多项式时间内实现VCG机制。

证明思路(概要):

步骤1:利用对偶规划与椭球算法
我们想要解决原始线性规划,但其变量数(n * 2^m)是指数级的。然而,其对偶规划的变量数很少(只有 n + m 个:u_ip_j),但约束数量是指数级的(对所有 iS)。
椭球算法是一种强大的理论工具,它可以解决变量数较少、约束数指数多但存在高效“分离预言机”的线性规划。分离预言机能在多项式时间内,验证一个给定的对偶解 (u, p) 是否可行,若不可行则给出一个被违反的约束。
对于我们的对偶规划,检查约束 u_i ≥ max_S { v_i(S) - Σ_{j∈S} p_j } 是否成立,恰好等价于向估值黑箱 v_i 进行一次需求查询(计算右端的最大值)。因此,在需求查询可用的假设下,我们拥有一个高效的分离预言机。应用椭球算法,我们可以在多项式时间内(调用多项式次需求查询)求解对偶规划,得到最优对偶值 D*

步骤2:利用强对偶性与总替代品性质
根据强对偶性,原始线性规划的最优值 P* 等于对偶最优值 D*。由于总替代品性质保证了线性规划松弛的精确性,这个 P* 也正是原始整数规划(即实际福利最大化问题)的最优值。至此,我们知道了最大福利是多少。

步骤3:通过自归约重构最优分配
知道最优值后,我们需要找出是哪个分配实现了这个最优值。这可以通过“自归约”技术完成。基本思想是:依次考虑每个物品,尝试将其分配给不同的竞拍者,然后利用“求解最优值”的预言机(我们现在已经拥有,即步骤1-2的整个过程)来计算剩余子问题的最优值。通过比较这些最优值,我们可以推断出该物品在全局最优分配中应该属于谁。重复此过程,即可逐步重构出整个最优分配。这个过程需要多次调用步骤1-2的算法,但总次数仍是多项式级别。

通过以上三个步骤,我们便能够在多项式时间内计算出福利最大化的分配,进而实现VCG机制。

总结

本节课中我们一起学习了如何在总替代品估值下实现多项式时间的福利最大化。我们从基础的二分图匹配问题出发,建立了线性规划、对偶理论与瓦尔拉斯均衡之间的优美联系。我们将此框架推广到一般估值,并指出总替代品条件是保证线性规划松弛精确性(从而瓦尔拉斯均衡存在)的关键。最后,我们利用对偶规划变量少的特点,结合强大的椭球算法和需求查询模型,勾勒出了在总替代品下多项式时间求解福利最大化问题(从而运行VCG机制)的证明蓝图。这凸显了总替代品作为计算易处理性与良好市场均衡性质交汇点的重要地位。

007:子模估值

概述

在本节课中,我们将学习子模估值这一概念,探讨其与先前学习的总替代估值之间的关系,并分析在子模估值下福利最大化问题的计算复杂性与近似算法。我们将看到,虽然精确福利最大化变得困难,但通过巧妙的算法设计,我们仍然可以获得有保证的近似解。


公告与课程安排

练习集3今天截止。后续的练习集将包含更多可选问题,以便大家能将精力更多地投入到项目上。

关于项目,我已发布了第一批选题。请在一周后(2月7日)提交你的前两个选择,我将进行集中匹配。这是本学期人数较少的课程,我期待能与各位同学进行更多一对一的交流,欢迎随时通过邮件与我讨论项目选题。

应部分同学要求,将有一场关于总替代估值理论的额外讲座,时间是2月7日,地点在GS 315,该讲座不会被录像。


回顾:总替代估值与升价拍卖

上一讲我们讨论了总替代估值,这是保证瓦尔拉斯均衡存在的一类估值函数。我们证明了在此条件下,可以在多项式时间内最大化社会福利并实现VCG机制。

然而,实现一个能收敛到VCG结果的升价拍卖则更具挑战性。事实上,Gul和Stacchetti证明了,对于总替代估值,不存在一个仅使用升价轨迹和需求查询就能保证终止于VCG结果的升价拍卖。这是一个信息论上的不可能性结果。

为了规避这一不可能性,研究者们提出了两种扩展方案:

  1. 允许多条升价轨迹:Ausubel提出了一种算法,通过运行 n+1 条升价轨迹(其中 n 是竞拍者数量),可以收集足够信息来计算VCG支付。这本质上与计算VCG机制需要解决 n+1 个福利最大化问题思路一致。
  2. 允许捆绑(组合)出价:这更贴近实践。在这种拍卖中,为每个竞拍者 i 和每个物品组合 S 维护一个个性化价格 P_i(S)。拍卖过程类似于Crawford-Knoer拍卖,但竞拍者是对捆绑包出价。在总替代条件下,此类拍卖会收敛到最低竞争均衡,该均衡恰好对应VCG支付。

由此可见,总替代估值是多个“优良性质”的边界:对于线性定价(物品单价),它是均衡存在的边界;对于捆绑定价的升价拍卖,它是能收敛到VCG结果的边界。


引入子模估值

现在,我们迈出看似微小但关键的一步,进入一个更一般的类别:子模估值。这是我们的第六种场景。

定义:一个估值函数 v: 2^M -> R 是子模的,如果对于所有物品集合 S ⊆ T ⊆ M 和任意物品 j ∉ T,满足:
v(S ∪ {j}) - v(S) ≥ v(T ∪ {j}) - v(T)
直观上,这意味着“边际收益递减”:你拥有的物品越多,新增一个物品带给你的额外价值就越小。

非示例:单一需求估值(只对完整集合有估值)不是子模的。考虑两个物品 {A, B},估值 v({A,B}) = 1,其他为0。则 v({A} ∪ {B}) - v({A}) = 1,但 v(∅ ∪ {B}) - v(∅) = 0,违反了子模不等式。


子模估值与总替代估值的关系

两者的直观含义相似,都体现了“收益递减”的思想,但定义方式不同。它们的关系如下:

  1. 总替代蕴含子模:任何满足总替代条件的估值函数都是子模的。这个证明需要巧妙地构造价格向量并利用总替代的定义。
  2. 子模不蕴含总替代:子模是更一般的条件。存在是子模但不是总替代的估值。一个经典例子是预算约束的加性估值
    • 设有三个物品,单个估值分别为1, 2, 3。
    • 总估值是各物品估值之和,但上限为3。即 v(S) = min(3, Σ_{j∈S} v_j)
    • 该函数是子模的,但不是总替代。可以构造价格向量证明,当物品B的价格上升时,竞拍者可能从需求集合 {A, B} 转向 {C},放弃了未被提价的物品A,违反了总替代条件。

因此,估值函数的层次结构如下:单位需求 ⊆ 总替代 ⊆ 子模。


子模估值下的福利最大化

对于总替代估值,我们可以在多项式时间内精确最大化社会福利。但对于子模估值,情况发生了变化。

关键事实:对于子模估值,福利最大化是NP难问题。即使只有两个具有预算约束加性估值的竞拍者,该问题也是NP难的。

这迫使我们重新思考机制设计的目标。我们一直追求三个目标:

  1. 强激励相容性(占优策略)
  2. 最优性能(福利最大化)
  3. 计算可处理性(多项式时间)

对于子模估值,目标2和3在P≠NP的假设下无法同时实现。因此,我们必须做出妥协。

本课程第二部分的方向:我们将放松目标2,转而追求近似福利最大化。我们仍将坚持占优策略激励相容性,并探索在计算可处理的前提下,能获得多好的近似保证。接下来的机制会变得相对复杂。


一个简单的近似算法:运行Kelso-Crawford拍卖

尽管Kelso-Crawford拍卖是为总替代估值设计的,但令人惊讶的是,对于子模估值,即使竞拍者真诚出价,它也能在终止时提供一个有保证的近似解。

定理:假设所有竞拍者都具有子模估值并真诚参与Kelso-Crawford拍卖。那么拍卖终止时得到的分配,其社会福利至少是最优社会福利的 1/2

证明概要
证明的核心在于一个引理:在拍卖的任何时刻,对于任何竞拍者 i 及其当前持有的物品集合 S_i任何子集 A ⊆ S_i,都有 v_i(A) ≥ 当前为A中物品支付的总价格

  • 这通过归纳法证明,关键在于利用子模性。假设竞拍者 i 新获得物品后,存在一个“坏集合”A使其支付超过估值。考虑向集合X(A中旧物品)逐个添加Y(A中新物品)的过程,由于子模性,最后一个导致不等式翻转的物品 j 的边际价值很低,以至于 i 最初就不应该竞标包含 j 的集合,这与真诚出价(即竞标效用最大化的集合)矛盾。

由该引理可得一个推论:在拍卖终止时,所有物品的价格总和不超过最终分配的社会福利

最后,利用拍卖终止条件(无人想再获得新物品),我们可以将最优分配与最终分配的社会福利进行比较。通过加总所有竞拍者的终止条件不等式,并利用上述推论,经过代数推导即可得到 最终福利 ≥ 1/2 * 最优福利

这个证明风格类似于上季度“无政府状态代价”的分析模板。


总结

本节课中,我们一起学习了:

  1. 子模估值的定义及其直观含义(边际收益递减)。
  2. 子模估值与总替代估值的关系:总替代是子模的真子集。
  3. 在子模估值下,精确福利最大化是NP难的,因此必须转向近似算法。
  4. 介绍了第一个近似算法:直接为子模估值运行Kelso-Crawford拍卖,可以获得2-近似的福利保证。证明的关键在于利用子模性确保竞拍者在终止时拥有非负效用,并将总价格与社会福利联系起来。

这标志着课程第一部分的结束。从下一讲开始,我们将深入探索在更难的问题场景中,如何设计具有近似保证且激励相容的机制。

008:MIR和MIDR机制

在本节课中,我们将探讨如何将近似算法与机制设计相结合,特别是在多参数环境下设计具有良好激励保证的机制。我们将从已知的VCG机制出发,介绍两种重要的机制设计框架:最大范围机制和最大分布范围机制,并分析它们在特定场景下的应用。


上一节我们介绍了近似算法在福利最大化问题中的应用,本节中我们来看看如何将其与激励兼容机制结合。

将近似算法直接嵌入VCG机制通常无法保证激励兼容性。这是因为VCG支付的设计初衷是使竞拍者的效用与社会总福利对齐。当分配规则是次优的时,就为竞拍者通过虚报来诱导算法输出更高社会福利(从而为自己带来更高效用)提供了机会。

因此,对于多参数问题,在坚持占优策略激励兼容的前提下,可行的机制设计空间非常有限。接下来,我们将从VCG机制出发,探索一些可行的扩展。


机制设计:第8讲:最大范围机制

最大范围机制是VCG机制的一个直接扩展。其核心思想是预先承诺一个易于优化的结果子集,然后在该子集上运行VCG机制。

定义:一个MIR分配规则的结构如下:

  • 存在一个结果空间 Ω(例如所有可能的物品分配方案)。
  • 机制在观察到任何估值之前,预先承诺一个子集 Ω‘ ⊆ Ω。该子集应满足:在Ω‘上优化是计算易处理的(例如,Ω‘规模较小或结构良好)。
  • 当报价到来后,机制在Ω‘上运行标准的VCG机制(即选择最大化报告福利的结果,并计算VCG支付)。

MIR机制显然是占优策略激励兼容的,因为它本质上只是在一个人为限制的结果空间上运行的VCG机制。

以下是MIR机制的一个应用示例:同质多物品拍卖。

考虑一个拍卖场景:有M个完全相同的物品,n个竞拍者。竞拍者i对第j个物品的边际估值μ_ij非负,但不要求边际估值递减(即不要求满足“向下斜率”属性)。

  • 精确算法:通过动态规划可以在关于n和M的多项式时间内精确最大化福利。但这通常被认为是伪多项式时间(依赖M的大小)。
  • MIR近似算法:我们可以设计一个MIR机制,实现1/2近似的福利,且运行时间(及价值查询次数)为关于n和log M的多项式。这对于M很大时是一个显著优势。

MIR构造

  1. 构造限制空间Ω‘:将M个物品分成n²个块,每块包含 M/n² 个物品。Ω‘ 仅包含那些以整块为单位分配物品的方案。
  2. 优化:在这个仅有n²个“元物品”的新问题上运行动态规划算法,找到Ω‘中福利最大的分配。
  3. 支付:按照VCG规则计算支付。

近似比分析
设最优分配为 (S1, …, Sn)。我们证明存在一个Ω‘中的分配,其福利至少是最优福利的一半。

  • 情况1:如果某个竞拍者i在最优分配中贡献了至少一半的福利,那么将全部M个物品分配给i的方案在Ω‘中,且其福利至少为最优的一半。
  • 情况2:否则,每个竞拍者贡献都小于一半。由于有n²个块和n个竞拍者,根据鸽巢原理,存在某个竞拍者i获得了至少n个块。我们可以构造新分配:对于所有 k ≠ i,将 Sk* 向上取整到最近的整块;竞拍者i获得剩余物品(可能为0)。这样,其他竞拍者获得的物品数都不少于最优情况,因此贡献的福利之和至少是最优总福利的一半(因为i的贡献小于一半)。而i的福利非负,故新分配的总福利至少是最优的一半。

上一节我们看到了MIR机制的应用,本节中我们来看看其随机化推广:最大分布范围机制。

最大分布范围机制是MIR机制的随机化推广,它通过允许在结果分布上进行优化,有时能获得更好的近似比和计算性质。

定义:一个MIDR分配规则的结构如下:

  • 机制在观察到估值前,预先承诺一个分布集合 D,其中每个元素D是结果空间Ω上的一个概率分布。
  • 当报告估值 v 到来后,机制选择能最大化期望福利的分布 D* ∈ D。即:
    D* = argmax_{D ∈ D} E_{ω ~ D} [ Σ_i v_i(ω) ]
  • 机制最终从分布 D* 中随机采样一个结果ω输出。

MIDR机制可以配备类似VCG的支付规则,从而构成一个占优策略激励兼容的机制(假设竞拍者是风险中性的,即根据期望效用决策)。

练习:如果分配规则x是MIDR的,且支付规则p是VCG支付的类比(即基于期望福利的外部性计算),那么机制(x, p)是占优策略激励兼容的。

目前,绝大多数已知的多参数、近似、占优策略激励兼容机制都属于MIDR框架。这凸显了在该框架内进行创造性设计的重要性。


上一节引入了MIDR框架,本节中我们来看一个能利用该框架取得强正结果的场景:多类物品且有充足供给。

考虑场景8:有m类不同的物品,每类物品有k个完全相同的副本(总物品数为k*m)。每个竞拍者i对每类物品最多只需要一个单位,但其对物品组合的估值v_i(S)可以是任意单调函数(不要求子模性等)。

关键结论:只要每类物品的供给量k足够大,我们就能获得接近最优的福利近似。
定理:存在某个常数c,当 k ≥ c * log(m) / ε² 时,存在一个算法(后续可转化为MIDR机制),其福利至少是最优福利的 (1 - ε) 倍,且运行时间及需求/价值查询次数为关于所有参数的多项式。

以下是该算法的核心步骤:线性规划松弛与随机舍入。

  1. 构造并求解线性规划松弛
    我们使用之前介绍过的配置线性规划,但约束修改为每类物品j最多分配k次。

    • 变量:x_i,S 表示竞拍者i获得物品组合S的概率。
    • 目标:最大化 Σ_i Σ_S v_i(S) * x_i,S。
    • 约束
      • 对每类物品j:Σ_i Σ_{S: j∈S} x_i,S ≤ k。
      • 对每个竞拍者i:Σ_S x_i,S ≤ 1。
      • x_i,S ≥ 0。
        该LP可以通过椭球法在需求查询模型下多项式时间内求解。设其最优解为 x*,最优值为 OPT_LP ≥ OPT(整数最优解)。
  2. 随机舍入
    对每个竞拍者i独立进行如下操作:以概率 (1-ε) * x*_i,S 将组合S分配给i,剩余概率分配空集。这定义了一个随机分配算法。

  3. 分析

    • 期望福利:由于独立性,期望福利为 Σ_i Σ_S v_i(S) * [(1-ε) x*_i,S] = (1-ε) * OPT_LP ≥ (1-ε) * OPT。
    • 可行性(供给约束):对于每类物品j,分配给它的副本数是一个随机变量和。其期望值 ≤ (1-ε)k。利用切尔诺夫界,当k = Ω(log m / ε²)时,可以证明所有物品j的分配数超过k的概率极低(通过取并集)。因此,通过多次重复随机舍入,我们能以高概率得到一个可行(即未超售)且福利接近期望值的整数分配。

这个算法解决了计算问题。在下节课中,我们将展示如何巧妙地调整此算法,使其成为一个MIDR分配规则,从而获得完整的占优策略激励兼容机制。


总结

本节课中我们一起学习了:

  1. 挑战:将近似算法与多参数环境下的激励兼容机制结合非常困难,直接替换VCG的分配规则通常行不通。
  2. 最大范围机制:通过预先限制结果空间到易于优化的子集,然后运行VCG,可以在某些问题(如供给充足的同质物品拍卖)中获得计算效率与近似比的平衡。
  3. 最大分布范围机制:MIR的随机化推广,允许在结果分布上优化。这是当前设计多参数近似DIC机制的主要框架。
  4. 一个应用场景:对于每类物品有Ω(log m / ε²)副本的多类物品拍卖,存在基于线性规划松弛和随机舍入的高效近似算法,这为下一讲构造MIDR机制奠定了基础。

下节课我们将深入探讨如何将上述算法转化为一个MIDR机制,并回顾子模估值场景下的进展。

009:通过缩放算法实现MIDR机制

在本节课中,我们将学习如何将上周讨论的近似算法转化为具有激励相容性的机制。具体来说,我们将介绍一种称为“缩放算法”的特殊随机舍入方法,并展示如何利用它来构建“最大分布范围”机制,从而在保证近似比的同时,实现占优策略激励相容。


回顾:场景与算法基础

上一讲我们研究了一个特定场景:存在多种非相同物品,每种物品有K个副本,竞拍者对物品组合的估值是完全任意的(非模块化)。我们假设每个竞拍者对每种物品最多只需要一个副本。

我们暂时搁置了激励问题,专注于福利最大化的算法问题。我们证明,如果每种物品的供应量K至少为 log(M) / ε²,则存在一个多项式时间算法,能够以 (1 - ε) 的近似比求解福利最大化问题。

该算法的核心是一个两阶段过程:

  1. 求解线性规划松弛:首先求解福利最大化问题的LP松弛,得到一个最优分数解 y*
  2. 随机舍入:将 y*(1 - ε) 缩放,然后根据缩放后的概率分布,独立地为每个竞拍者随机分配一个物品组合。通过多次独立重复此过程,我们能够以高概率得到一个可行(即不超过供应限制)且福利接近LP解值的分配方案。

从算法到机制:MIDR 的概念

现在,我们将重新引入激励约束。我们的目标是设计一个占优策略激励相容的机制。当问题变得NP难时,经典的VCG机制不再适用。因此,我们需要扩展我们的机制设计工具箱。

我们引入了一个比“最大范围”机制更一般的概念:最大分布范围 机制。

一个MIDR分配规则定义如下:

  • 我们预先承诺一个分布集合 D,其中的每个元素 d ∈ D 是可能分配结果的一个概率分布。
  • 给定竞拍者报告的估值 v,机制选择能最大化期望福利的分布 d* ∈ D。即:
    d* = argmax_{d ∈ D} E_{ω ~ d} [ Σ_i v_i(ω_i) ]
  • 然后,机制从分布 d* 中随机抽取一个分配结果 ω 作为最终输出。

可以证明,存在一种与VCG支付类似的支付规则,与此分配规则结合后,能构成一个占优策略激励相容的机制。

MIDR机制的优势在于,通过优化分布而非具体的分配结果,我们有时可以在保持激励性的同时,处理那些对确定性算法来说很难的问题。


缩放算法:连接算法与MIDR的桥梁

为了将我们已有的近似算法转化为MIDR机制,我们引入一类特殊的随机舍入算法,称为缩放算法

考虑以下通用的算法框架:

  1. 求解LP:针对估值 v,计算最优LP解 y*
  2. 随机舍入:通过一个“遗忘型”舍入算法 R,将分数解 y* 转化为一个随机的分配结果 ω。所谓“遗忘型”,是指舍入算法 R 仅依赖于输入的 y*,而不回头查看原始的估值 v

定义(α-缩放算法):一个遗忘型随机舍入算法 R 被称为 α-缩放算法,如果对于任何输入的可行LP解 y,以及任何竞拍者 i 和物品组合 S,都有:
Pr[ i 在 R(y) 的输出中获得组合 S ] = α * y_i(S)
其中,α 是一个介于0和1之间的常数。

关键性质:如果一个算法是α-缩放算法,那么由“先求解最优LP,再应用该舍入算法”所诱导出的分配规则,就是一个MIDR规则。

原因:对于任何LP解 y,经缩放算法 R 处理后,输出分配的期望福利恰好是 α 乘以 y 的分数福利值。由于这个缩放因子 α 是全局一致的,因此优化原始LP解优化最终输出分布的期望福利是完全等价的。我们通过优化LP解 y*,间接地优化了MIDR定义中所要求的分布。


构造缩放算法:Levi-Swamy方法

我们上周的算法本身并不是一个缩放算法(因为其最终输出条件依赖于可行性和福利值,破坏了精确的缩放关系)。然而,Levi和Swamy证明,只要存在一个像上周那样的 (1-ε) 近似随机舍入算法,就必然可以构造出一个 (1-ε) 近似的缩放算法

以下是构造的核心思路:

  1. 输入:给定最优LP解 y*
  2. 求解第二个线性规划:我们构造并求解第二个LP,其决策变量是各种可能分配结果的概率 λ_ω。该LP的约束条件是:对于所有在 y* 中非零的竞拍者-组合对 (i, S),分配结果分布必须满足:
    Σ_{ω: ω_i = S} λ_ω = (1 - ε) * y*_i(S)
    此外,λ_ω 需构成一个概率分布(非负且和为1)。
  3. 输出:求解该LP后,我们得到一个显式的、支持集大小有限的概率分布 λ。这个分布 λ 本身就是一个 (1-ε) 缩放算法——只需从这个分布中抽样即可。

关键挑战与解决:第二个LP有指数级的变量(所有可能的分配)和多项式级的约束(y* 中非零的项)。我们通过研究其对偶问题来解决它:

  • 对偶问题的变量是伪估值 z_i(S) 和一个标量 z*
  • 对偶约束要求:对于所有分配 ω,其伪福利 Σ_i z_i(ω_i) 不超过 z*;同时,y* 的伪福利至少为 z* / (1-ε)
  • 分离预言机:给定一组 (z, z*),我们需要判断是否所有对偶约束都满足。若不满足,则需找到一个违反的约束(即一个伪福利过高的分配 ω)。
    • 首先检查 y* 的伪福利约束。
    • 若通过,则将 z 的负值置零得到 z+,将其视为估值,并运行上周的近似算法(以 y* 作为输入进行舍入)。上周算法的保证是,其输出分配的 z+ 福利至少为 (1-ε) 倍的 y*z+ 福利值。
    • 由于 z+ 的福利不低于 z 的福利,且 y*z 福利至少为 z*,因此上周算法输出的分配 ω 的伪福利 Σ_i z_i(ω_i) 将严格大于 z*。这就找到了一个违反的对偶约束。
  • 应用椭球法:利用上述分离预言机,我们对对偶问题运行椭球法。由于分离预言机总能找到违反约束,这证明了对偶问题是不可行的
  • 根据强对偶性,原LP(第二个LP)是可行的。椭球法的运行过程还会产生一组多项式数量的关键约束(即它找到的那些违反约束)。我们仅保留与这些约束对应的原LP变量,得到一个规模为多项式的LP,可以直接求解,从而得到我们想要的分布 λ

总结

本节课我们一起学习了如何将近似算法提升为具有激励相容性的机制:

  1. 我们首先回顾了在物品供应充足时,存在高效的 (1-ε) 近似福利最大化算法。
  2. 为了引入激励,我们介绍了最大分布范围 机制的概念,它是设计多参数激励相容机制的一个重要工具。
  3. 我们定义了一类特殊的随机舍入算法——缩放算法,并证明了由缩放算法诱导出的分配规则自动满足MIDR性质,从而能与VCG类支付结合形成DI机制。
  4. 最后,我们深入探讨了Levi-Swamy方法,它巧妙地利用“存在一个非缩放的近似算法”这一事实,通过求解一个辅助线性规划,显式地构造出一个具有相同近似比的缩放算法,从而最终得到了一个多项式时间、(1-ε) 近似、占优策略激励相容的机制。

这个结果非常强大,它在几乎不影响算法性能的前提下,成功地为这个复杂的多物品拍卖场景添加了坚实的激励保证。在接下来的课程中,我们将看到MIDR机制的另一个应用实例。

010:覆盖估值与凸舍入

在本节课中,我们将学习如何为覆盖估值设计一个最大内部支配范围(MIDR)机制,该机制能获得匹配的近似保证。我们将从回顾上一讲的内容开始,然后深入探讨如何超越缩放算法,并最终构建一个具有良好性质的舍入算法。

概述

上一讲中,我们讨论了分离预言机的实现细节,可能使其听起来比实际情况更复杂。本节将澄清这一点,并以此为基础,探讨如何为子模估值的一个子类——覆盖估值——设计一个MIDR机制。我们将看到,通过直接优化舍入算法的输出,并精心设计舍入概率函数,可以获得一个在计算上可处理、具有激励相容性且达到1-1/e近似比的机制。

分离预言机澄清

上一节我们介绍了如何将椭球算法应用于对偶线性系统,并论证其不可行性。本节中,我们来看看分离预言机的具体实现细节。

首先,我们需要检查对偶系统中的最后一个约束。如果该约束被违反,我们可以直接返回一个违反的约束。

如果最后一个约束未被违反,那么我们可以从约束族中轻松生成一个违反的约束。具体步骤如下:

  1. 对之前为真实估值 $V_i$ 求解线性规划松弛得到的最优分数解 $Y^*$,应用随机舍入。
  2. 将 $Y^*$ 按一个小的因子(例如 $1-\epsilon$)缩放,然后应用随机舍入算法。
  3. 随机舍入会产生一个整数解(分配方案)。
  4. 由于分数解 $Y^$ 对于虚构的估值 $Z_i$ 已经优于 $Z^$(即大于 $Z^$),经过缩放和舍入后得到的整数解,其期望值仍然严格优于 $Z^$。
  5. 因此,这个整数解就构成了一个违反的约束,可以返回给分离预言机。

这个实现的核心在于利用了随机舍入的基本性质:对一个可行的线性规划解进行略微缩放后的随机舍入,其期望值几乎与原解一样好。

回到子模估值

在完成了关于多物品拍卖等内容的探讨后,我们现在回到最初的问题:子模估值。我们之前已经看到,一旦超越总替代品(Gross Substitutes)进入一般的子模估值领域,社会福利最大化就变成了NP难问题。虽然存在近似算法(如Kelso-Crawford拍卖给出1/2近似),但我们的目标是设计一个同时具有良好的近似比和激励相容性(DSIC)的机制。

覆盖估值:一个可处理的子类

本节我们将关注子模估值的一个子类:覆盖估值。这是我们可以应用MIDR机制框架来解决的一个特例。

一个估值函数 $V_i$ 被称为覆盖估值,如果它具有以下形式:存在一个基础集 $X_i$(例如城市集合),对于每个物品 $j$,对应一个子集 $A_{ij} \subseteq X_i$。竞拍者 $i$ 对一组物品 $S$ 的估值,等于这些物品对应子集的并集的大小:
$$
V_i(S) = \left| \bigcup_{j \in S} A_{ij} \right|
$$
可以将其理解为,物品是广播许可证,$A_{ij}$ 是许可证 $j$ 能覆盖的城市,竞拍者的价值就是其拥有的许可证所能覆盖的不同城市总数。

覆盖估值是子模的。然而,即使对于覆盖估值,社会福利最大化仍然是NP难的。已知最好的不可能性结果是:不存在多项式时间算法能获得优于 $1 - 1/e$(约63%)的近似比。我们的目标是设计一个MIDR机制,达到这个匹配的近似保证。

超越缩放算法:新的思路

Levi-Swamy框架不适用于覆盖估值,主要原因有两个:1)该框架需要处理对偶算法可能产生的任意估值 $Z_i$,而我们只对子模估值有好的近似算法;2)覆盖估值不支持在多项式时间内回答需求查询。

因此,我们需要超越缩放算法。缩放算法的特点是,优化舍入算法的输入(线性规划解)等价于优化其输出(分配分布)。对于大多数舍入算法,这个性质并不成立。

直接优化输出分布

为了确保获得MIDR性质,我们提出一个不同的思路:直接优化舍入算法输出的期望福利,而不是优化输入线性规划解的值。

具体来说,我们考虑以下优化问题:
$$
\max_{y \in \text{LP可行域}} \mathbb{E}_{x \sim R(y)} \left[ \sum_i V_i(x_i) \right]
$$
其中 $R(y)$ 表示对线性规划解 $y$ 应用某个固定的舍入算法 $R$ 后得到的随机分配分布。

这个分配规则天然就是MIDR。 因为它的值域就是舍入算法 $R$ 在所有可行 $y$ 上产生的输出分布的集合,而规则选择了其中能最大化期望社会福利的那个分布。

现在,挑战在于:对于哪些舍入算法 $R$,这个优化问题是可高效求解的?如果目标函数关于决策变量 $y$ 是凹的,那么在线性约束下最大化凹函数是一个可处理的问题。因此,我们的新目标是:寻找一个非缩放的舍入算法 $R$,使得上述期望福利函数是凹的,并且能提供好的近似比。

一个失败的尝试与启发

为了理解如何设计这样的 $R$,我们先看一个简单的、但行不通的例子。

考虑一个简单的线性规划:变量 $y_{ij}$ 表示物品 $j$ 分配给竞拍者 $i$ 的比例,约束是每个物品最多分配一次($\sum_i y_{ij} \le 1$)。初始的舍入算法 $R_0$ 是:对每个物品 $j$ 独立地,以概率 $y_{ij}$ 将其分配给竞拍者 $i$(剩余概率表示物品未分配)。

对于覆盖估值,竞拍者 $i$ 的期望福利可以分解为其基础集 $X_i$ 中每个元素 $a$ 被覆盖的概率之和。元素 $a$ 被覆盖的概率是:
$$
1 - \prod_{j: a \in A_{ij}} (1 - y_{ij})
$$
我们需要这个表达式关于 $y$ 是凹的。但可以验证,它并不是凹的。更重要的是,这个舍入算法 $R_0$ 会将整数解(0-1向量)原封不动地输出为点质量分布。这意味着优化其输出分布包含了优化所有整数分配,这本身是NP难的,因此不可能高效。

这个失败的例子告诉我们:任何将整数解映射回自身的舍入算法,其对应的优化问题都是难解的。

设计成功的舍入算法

我们需要修改舍入算法,使其不会忠实地执行整数解。一个自然的想法是“缩小”分配概率。我们不再使用概率 $y_{ij}$,而是使用一个变换后的概率 $f(y_{ij})$,其中 $f$ 是一个函数。

我们对函数 $f$ 有三个期望:

  1. $f(y) \le y$,以保证概率和不超过1,并且避免忠实执行整数解。
  2. $f(1)$ 不能太大,否则会违反近似比的下界。已知的 $1-1/e$ 不可近似性提示我们,或许 $f(1)$ 应约为 $1-1/e$。
  3. 最重要的是,替换后的期望福利函数必须是凹的。

一个满足前两个性质的简单猜测是:$f(y) = 1 - e^{-y}$。这个函数始终满足 $f(y) \le y$,且 $f(1) = 1 - 1/e$。

令人惊喜的是,这个选择也自动满足了第三个性质——凹性。将 $f(y) = 1 - e^{-y}$ 代入期望福利的表达式后,竞拍者 $i$ 的期望福利中关于元素 $a$ 的部分变为:
$$
1 - \prod_{j: a \in A_{ij}} e^{-y_{ij}} = 1 - e^{-\sum_{j: a \in A_{ij}} y_{ij}}
$$
这是关于变量 $y_{ij}$ 的凹函数(因为指数函数是凸的,其负指数是凹的)。由于凹函数的和仍是凹函数,整个目标函数是凹的。

最终的机制

因此,我们得到了以下机制:

  1. 舍入算法 $R$:对于给定的分数解 $y$,对每个物品 $j$ 独立地,以概率 $f(y_{ij}) = 1 - e^{-y_{ij}}$ 将其分配给竞拍者 $i$。
  2. 分配规则:求解如下优化问题,得到最优解 $y^$:
    $$
    \max_{y \ge 0, , \sum_i y_{ij} \le 1 , \forall j} \sum_{i} \sum_{a \in X_i} \left( 1 - \exp\left( -\sum_{j: a \in A_{ij}} y_{ij} \right) \right)
    $$
    然后,对 $y^
    $ 应用上述舍入算法 $R$,输出得到的随机分配。

这个机制是MIDR的(由构造决定),并且由于目标函数是凹的且约束是线性的,可以在多项式时间内求解(例如使用椭球法)。

近似比分析

最后,我们需要证明这个机制能提供 $1-1/e$ 的近似比。根据MIDR的性质,我们只需要证明存在一个可行的分数解 $\hat{y}$,使得应用舍入算法 $R$ 后的期望福利至少是最优整数解福利的 $1-1/e$ 倍。那么,机制选择的 $y^*$ 的福利只会更好。

我们选择 $\hat{y}$ 为最优整数分配 $S^*$ 的指示向量:如果物品 $j$ 在最优分配中给了 $i$,则 $\hat{y}_{ij}=1$,否则为0。

我们需要证明,对于每个竞拍者 $i$,在舍入算法 $R$ 下,其期望价值至少是其最优捆绑 $S_i^*$ 价值的 $1-1/e$ 倍。

证明思路如下:考虑按任意顺序将 $S_i^$ 中的物品逐个加入。在整数最优世界中,每加入一个物品带来一个边际价值。在舍入世界中,每个物品 $j$ 有独立的 $f(1)=1-1/e$ 的概率被获得。由于子模性(边际价值递减),当你在舍入世界中只拥有之前物品的一个子集时,你对当前物品的边际价值不低于在整数世界中拥有全部之前物品时的边际价值。因此,舍入世界中获得的期望价值,至少是每个物品的获得概率 $(1-1/e)$ 乘以在整数世界中的边际价值之和,而后者正好是 $V_i(S_i^)$。因此,期望价值至少为 $(1-1/e) V_i(S_i^*)$。

对所有竞拍者求和,即得总的期望福利至少为 $(1-1/e) \cdot \text{OPT}$。

总结

本节课中,我们一起学习了如何为覆盖估值设计一个先进的MIDR机制。

  • 我们首先澄清了上一讲中分离预言机的实现细节。
  • 然后,我们回到了子模估值的挑战,并引入了覆盖估值这一可处理的子类。
  • 为了超越缩放算法,我们提出了直接优化舍入算法输出分布的新思路,这能天然保证MIDR性质。
  • 通过分析一个简单舍入算法失败的原因,我们得到启发:需要修改舍入概率。
  • 我们巧妙地选择了概率变换函数 $f(y) = 1 - e^{-y}$,这使得优化目标成为凹函数,从而可高效求解。
  • 最后,我们证明了该机制能达到 $1-1/e$ 的近似比,这与计算复杂度的下界匹配。

这个机制展示了如何将MIDR框架应用于非缩放算法,以解决具有挑战性的近似机制设计问题。在接下来的课程中,我们将探讨在更弱但更易实现的均衡概念下的机制设计。

011:非占优实施与收缩拍卖

在本节课中,我们将学习一种在激励兼容性要求上稍作妥协的机制设计方法。我们将探讨一种名为“收缩拍卖”的机制,它不要求参与者拥有占优策略,而是假设他们不会采取明显“愚蠢”(即被严格占优)的策略。通过这种放松,我们能够在多物品、多需求竞拍者的复杂场景中获得良好的社会福利保证。


课程概述

在之前的课程中,我们一直追求三个目标:强激励保证(如占优策略激励兼容)、高社会福利(最优或近似最优)以及多项式时间可计算的机制。然而,我们已经发现,在某些情况下,同时满足这三个目标非常困难,甚至是不可能的。

本节课程中,我们将放松对激励兼容性的严格要求。我们将介绍一种介于占优策略激励兼容和贝叶斯激励兼容之间的概念,即假设竞拍者不会采取被严格占优的策略。在此假设下,我们将分析一种名为“收缩拍卖”的机制,它能处理“单价值多需求竞拍者”这一复杂场景,并获得近似最优的社会福利。


场景设定:单价值多需求竞拍者

我们再次面对一组非相同的物品。每个竞拍者 i 对其想要的物品组合(称为“需求束”)有一个私人估值 v_i。关键假设是:

  • 竞拍者可能想要多个不同的物品束。
  • 但只要获得任意一个其想要的物品束,他就能获得相同的价值 v_i
  • 如果获得的物品不包含任何其想要的物品束,则价值为 0。

形式化定义:给定竞拍者 i 想要的一系列物品束集合 {A_i1, A_i2, ...},其估值函数为:

v_i(S) = v_i, 如果 S 包含某个 A_il
v_i(S) = 0,  否则

我们假设每个需求束的大小至多为 D(一个已知常数)。

例子

  1. 网络路径:竞拍者想要从源点到汇点的任意一条路径(物品是边,需求束是所有可能的路径)。
  2. 任务完成:竞拍者需要一组能完成某项任务的工人组合(物品是工人,需求束是所有能满足技能要求的工人子集)。

已知的可解特例

在深入未知领域前,我们先回顾两个可通过占优策略激励兼容机制解决的特例,以建立直觉。

特例一:公开已知的需求束

假设每个竞拍者 i 想要的需求束集合 {A_i1, A_i2, ...} 是公开已知的,只有估值 v_i 是私人的。这变成了一个单参数机制设计问题。

解决方案:贪心算法。

  1. 根据竞拍者报告的估值从高到低排序。
  2. 按顺序遍历竞拍者,如果当前竞拍者存在一个尚未被分配物品冲突的需求束,则分配给他一个这样的束。

性质:该机制是占优策略激励兼容的,并能获得至少 1/D 倍的最优社会福利。这是因为每次分配最多可能阻塞 D 个其他竞拍者,而他们的估值都不高于当前被分配的竞拍者。

特例二:单一未知需求束

假设每个竞拍者只想要一个特定的物品束 A_i,但这个束是未知的私密信息(估值 v_i 也未知)。这不再是单参数问题。

解决方案:同样的贪心算法。我们要求竞拍者同时报告其估值 v_i 和想要的物品束 A_i,然后按报告估值从高到低排序并贪心分配。

性质:该机制同样是占优策略激励兼容的,并能获得至少 1/D 倍的最优社会福利。直觉上,竞拍者没有动机谎报物品束(谎报可能导致得到无价值的物品),因此问题简化为类似单参数的情形。


收缩拍卖机制

现在,我们面对完整的场景:竞拍者有多个私密的、未知的需求束,且估值相同。我们将介绍由 Babaioff、Lavi 和 Pavlov 在 2006 年提出的收缩拍卖机制。

该机制是一个间接机制(类似升价拍卖),不直接询问竞拍者的估值或具体需求束,而是通过交互过程让他们逐步“聚焦”。

机制状态与初始化

  • b_i:竞拍者 i 的当前出价(初始为 1,即估值下界,只升不降)。
  • S_i:竞拍者 i 当前“可能获得”的物品集合(初始为全部物品,只减不增)。任何不在 S_i 中的物品绝不可能分配给 i
  • Losers:已永久退出拍卖的竞拍者集合。
  • old:上一轮迭代中计算出的(临时)获胜者分配方案。

主循环

当存在既未退出也未在上一轮获胜的竞拍者时,执行以下循环:

步骤 1:计算新的候选分配 new
我们模拟贪心算法,但需要竞拍者配合。

  1. 对所有未退出的竞拍者,按其当前出价 b_i 从高到低排序(按字典序打破平局)。
  2. 按顺序遍历竞拍者 i
    • 情况 A(可直接入选):如果 |S_i| <= DS_i 与当前 new 中已分配物品无冲突,则将 i 加入 new
    • 情况 B(需要收缩):如果 |S_i| > DS_inew 冲突,则向竞拍者 i 提供选择:
      • 收缩:竞拍者可以自愿将 S_i 缩小为一个子集 T_i|T_i| <= DT_inew 无冲突)。如果同意,则令 S_i = T_i,并将 i 加入 new
      • 跳过:拒绝收缩,则本轮跳过 i

步骤 2:更新临时获胜者
比较本轮计算的分配 new 与上一轮的分配 old 所产生的总出价和。保留总出价和更高的分配作为新的 old。这意味着 old 中保存的是至今为止找到的“最佳”临时分配。

步骤 3:处理失败者
对于所有未在 old 中的竞拍者(即本轮和之前轮次都未获胜),他们面临选择:

  • 加倍出价:将出价 b_i 翻倍。
  • 退出:永久退出拍卖(加入 Losers 集合)。

拍卖终止与结果

当没有新的竞拍者需要处理时,拍卖终止。

  • 最终分配:将 old 中每个竞拍者 i 对应的 S_i 分配给他。
  • 最终支付:每个获胜竞拍者支付其最终出价 b_i

行为假设与直觉

该机制没有占优策略。竞拍者需要做出非平凡决策:是收缩需求集以减少竞争,还是提高出价以在排序中靠前?

分析该机制的性能时,我们基于以下合理的弱行为假设(即竞拍者不采取明显愚蠢的策略):

  1. 不会过高出价:当出价 b_i 超过其真实估值 v_i 时,竞拍者会选择退出(因为获胜会带来负效用)。
  2. 不会过早退出:当出价 b_i <= v_i / 2 时,竞拍者不会退出(因为仍有获得非负效用的可能)。
  3. 明显时选择收缩:如果竞拍者不收缩就会导致被跳过,进而被要求加倍出价,而加倍后的出价将超过 v_i/2 从而迫使其退出,那么他应该选择收缩(只要存在一个可行的、大小不超过 D 的需求子集)。

这些假设不要求竞拍者了解他人信息,只需基于自身估值和需求进行理性计算,非常符合占优策略的思想精神。


性能分析概要

在以上行为假设下,收缩拍卖具有良好的理论保证。分析分为三步:

引理 1:迭代次数有限
拍卖的迭代轮数 R 至多为 O(log V_max),其中 V_max 是最大估值。关键点在于,该上界与竞拍者数量 n 无关。

证明思路:考虑最后一个退出者。如果他从未收缩,则其 S_i 过大无法获胜,每次失败都需加倍出价,O(log V_max) 轮后必然退出。如果他收缩过,则其最终 S_i 会与某个获胜者 j 的集合冲突。由于集合只减不增,两者在大部分轮次中都冲突,导致其中一人频繁失败并加倍出价,从而在 O(log V_max) 轮内退出。

引理 2:相对于受限最优的保证
S_hat_i 为竞拍者 i 在拍卖结束时的最终物品集。定义 OPT_hat 为在限制“每个竞拍者 i 只能获得 S_hat_i 中的物品”下的最大社会福利。
则收缩拍卖获得的社会福利至少为 OPT_hat / (2DR)

直观解释:这体现了使用贪心算法带来的损失(因子 D)以及每轮迭代可能选择不同分配方案带来的损失(因子 R)。

引理 3:受限最优接近全局最优
在行为假设下,有 OPT_hat >= OPT / (R+1)

直观解释:这量化了由于竞拍者早期“盲目”收缩聚焦而可能损失的社会福利。幸运的是,损失仅与迭代轮数 R(对数级)有关,而不是物品数或竞拍者数。

定理:整体近似比
结合引理 2 和 3,收缩拍卖机制是一个 1 / (D * (log V_max)^2) 近似的社会福利最大化机制。


总结与展望

本节课中,我们一起学习了一种放松激励兼容性要求的机制设计思路。通过假设竞拍者仅避免被严格占优的策略,我们分析了收缩拍卖机制。该机制能有效处理单价值多需求竞拍者这一复杂场景,并获得了与最优社会福利成对数多项式关系的近似保证。

虽然我们损失了部分近似比,并且机制不再是占优策略激励兼容的,但我们换来了更广泛场景下的可行性、更简单的机制结构,以及仍然非常弱且合理的竞拍者行为假设。这展示了在机制设计的三难困境中做出权衡的一种有趣途径。

在接下来的课程中,我们将转向另一种经典的放松方向:贝叶斯激励兼容性,即假设竞拍者的类型来自一个共同先验分布,并在此框架下寻求贝叶斯纳什均衡。

012:贝叶斯激励相容性

在本节课中,我们将学习机制设计中的一个前沿领域——贝叶斯激励相容性。我们将从一个具体的证明案例开始,理解如何分析一个“收缩机制”的性能,然后系统性地介绍贝叶斯纳什均衡的概念、实现原理,并探讨如何将好的近似算法转化为贝叶斯激励相容的机制。


证明部分:收缩机制的性能分析

上一节我们介绍了收缩机制的基本框架。本节中,我们来看看如何证明该机制在最小行为假设下,能获得接近最优社会福利的近似保证。

引理2与引理3概述

首先回顾一下记号。我们运行收缩机制直至完成。竞拍者 i 在过程中追逐的物品集合 S_i 会随时间收缩。在算法结束时,S_hat_iS_i 最终的最小集合。

我们定义 opt_hat 为:在强制只能将 S_hat_i 中的物品分配给竞拍者 i 的前提下,所能实现的最大社会福利。

额外记号:W_hat 是在 opt_hat 解中实际获得其所需物品包的获胜者集合,其中获胜者 i 获得的物品包为 T_hat_i。根据定义,T_hat_i 必须是 S_hat_i 的子集。

证明分为两部分:

  1. 引理2说明,我们的机制相对于基准 opt_hat 表现良好。
  2. 引理3说明,基准 opt_hat 与我们真正关心的实际最大社会福利 opt 相差不远。

引理2的证明

这里我们将利用“机制模拟贪心算法”这一事实来论证我们的分配是合理的。

固定一次迭代 R。令 L_R 表示在此轮迭代中退出的竞拍者集合。我们需要论证这些“失败者”集合的价值总和不会太大。

我们使用行为假设。具体是第三个行为假设:如果一个竞拍者面临“收缩或退出”的选择,且不收缩将导致其被踢出拍卖,而收缩可能使其获得分配,那么该竞拍者会选择收缩。

考虑在此轮迭代中退出的竞拍者。这意味着该竞拍者没有能力通过收缩来成为赢家。也就是说,对于贪心算法而言,当它处理到 L_R 中的某个竞拍者 i 时,i 所偏好的、S_i 的所有子集(包括 T_hat_i),都与贪心算法已经承诺分配的内容冲突。

以下是证明的关键点:
我们可以进行一个思维实验:想象我们再次运行贪心算法,但使用一组不同的、更小的集合。我们的主张是,输出结果将与原始运行完全相同

在实际机制中,我们运行贪心算法,考虑集合 S_i,并拒绝那些不匹配的集合。但在分析时,我们可以想象对于那些被拒绝的、但在最优解 opt_hat 中获胜的竞拍者(即 i ∈ L_R ∩ W_hat),他们声明的集合不是 S_i,而是他们在最优解中实际获得的物品包 T_hat_i。贪心算法仍然会拒绝这些人,输出完全相同。但从分析角度看,考虑右侧(修改后)的算法会使我们的近似保证看起来更好。

现在,我们终于使用贪心算法的性质。我们贪心算法的输出是所有获胜者及其出价。根据本讲开始时提到的保证(存在因子 D 的损失),其出价之和至少是任何其他可行解出价之和的 1/D

我们选择 L_R ∩ W_hat 中竞拍者的物品包 T_hat_i 作为这个“其他可行解”。由于这些竞拍者同时在最优解 opt_hat 中获胜,他们的物品包 T_hat_i 是互不相交的,因此这确实是一个可行解。

因此,我们有:

sum_{i in (winners of our greedy in iteration R)} bid_i >= (1/D) * sum_{i in L_R ∩ W_hat} bid_i

此外,根据行为假设(竞拍者在被要求出价超过其价值前不会退出),如果这些竞拍者在此轮退出,意味着他们的出价至少是其价值的一半。所以:

sum_{i in L_R ∩ W_hat} bid_i >= (1/2) * sum_{i in L_R ∩ W_hat} value_i

综合以上,我们得到在迭代 R 结束时,我们贪心算法获胜者的出价之和满足:

sum_{i in (our winners at end of iteration R)} bid_i >= (1/(2D)) * sum_{i in L_R ∩ W_hat} value_i

由于在收缩机制中,每一轮迭代的分配结果都比前一轮更优(出价之和单调不减),因此在拍卖最终结束时,获胜者的出价之和至少等于上述不等式右边。再根据行为假设(出价总是价值的低估),最终的社会福利至少也等于这个出价之和。

这个不等式对每一轮迭代 R 都成立。现在,我们对所有 R 轮迭代求和。求和后,左边是最终获胜者出价之和的 R 倍(实际上更大),右边覆盖了所有 W_hat 中曾经退出过的竞拍者。对于那些没有退出、最终在我们拍卖中获胜的竞拍者,我们可以将他们直接加到不等式两边。

最终我们得到:

(sum of bids of our final winners) >= (1/(2D)) * sum_{i in W_hat} value_i

sum_{i in W_hat} value_i 就是 opt_hat。引理2得证。

关键点: 证明中,第三个行为假设(当别无选择时竞拍者会收缩)使我们能够在此处应用贪心算法的 D 近似保证。前两个行为假设主要允许我们在出价和价值之间进行换算(假设竞拍者基本真实,误差在2倍内)。

引理3的证明

引理3说明,通过限制人们只能从其最终集合 S_hat_i 中获得物品,我们损失的社会福利不会太多。

我们需要证明:

opt_hat >= (1/(R+1)) * opt

其中 R 是迭代轮数。

F_R 为在第 R 轮迭代中首次收缩的竞拍者集合。F_0 为从未收缩的竞拍者。

以下是证明的关键观察:
考虑在同一轮迭代 R 中首次收缩的两个不同竞拍者。他们在此轮收缩到的物品包必须是互不相交的。因为要成功收缩,你提供的子集 T_i 必须与贪心算法在本轮迭代中已分配的内容不相交。因此,在同一轮中,后收缩者的物品包必须与前一个收缩者的物品包不相交。此后,这些物品包只会缩小,因此在算法结束时它们仍然不相交。

这非常有用:每一轮迭代中,所有首次收缩的竞拍者构成了物品的一个合法划分(无重叠)。

现在考虑最优解 opt 中的赢家集合 W

  • 对于从未收缩的赢家 (i ∈ F_0 ∩ W),由于他们没有收缩,S_hat_i = U(全集),在受限优化问题 opt_hat 中对他们没有限制,因此可以直接采用 opt 中对他们的分配。
  • 对于在迭代 R 中首次收缩的赢家,根据上述观察,所有 F_R 中的竞拍者(无论是否在 W 中)的物品包是互不相交的,因此同时分配给他们所有人是 opt_hat 的一个可行解。

因此,我们有:

opt_hat >= sum_{R=0 to R} (sum_{i in F_R} value_i * [i is allocated in opt_hat solution described above])

其中 R=0 对应未收缩者。右边至少包含了所有真实最优解 opt 中的赢家 W(因为 F_R 覆盖了所有竞拍者)。所以:

(R+1) * opt_hat >= opt

即:

opt_hat >= (1/(R+1)) * opt

引理3得证。

结合引理2和引理3,我们得到总损失为 D * (R+1)。由于 Rlog(V_max) 量级,因此最终近似比为 D * log^2(V_max)


贝叶斯激励相容性基础

上一部分我们分析了一个在弱行为假设下的机制。现在,我们转向一个更标准的松弛激励相容概念——贝叶斯激励相容性。本节将主要奠定理论基础。

在高层次上,当不存在明显的占优策略,且最佳应对取决于其他参与者的行动时,贝叶斯激励相容性的解决方案是:引入先验信念。我们假设每个竞拍者不知道他人的确切估值,但至少知道他人估值的概率分布。

模型设定

  • 类型空间 T_i:参与者的私人信息,例如估值。
  • 行动空间 A_i:参与者可以采取的行动,例如出价。
  • 策略 σ_i:从类型到行动(或行动分布)的映射。
  • 共同先验 F:类型空间上的一个共同知识分布。我们主要讨论独立乘积分布的特殊情况。

贝叶斯纳什均衡

一个策略组合 (σ_1, ..., σ_n) 是贝叶斯纳什均衡,当且仅当对于每个参与者 i 和其每个可能的估值 v_i,策略 σ_i 指示的行动 σ_i(v_i) 能最大化其贝叶斯期望效用

参与者的期望是对其他参与者的类型 v_{-i} 取的,v_{-i} 从先验分布 F 中抽取,并以 v_i 为条件(在独立情况下,条件不影响分布)。参与者假设其他参与者按照策略组合 σ_{-i} 行动。

与其他均衡概念的比较:

  • 占优策略均衡:无论他人采取什么行动,我的策略都是最优的。最强。
  • 事后纳什均衡:对于他人类型的每一个可能取值,给定他人按策略行动,我的策略是最优的。较强。
  • 贝叶斯纳什均衡:在他人类型的分布上,我的策略在期望意义下是最优的。较弱。

对于直接显示机制,占优策略均衡和事后纳什均衡是重合的。

示例:一价拍卖

假设两个竞拍者,估值独立同分布于 [0, 1] 上的均匀分布。一价拍卖没有占优策略。

主张:出价 bid_i = v_i / 2 是一个贝叶斯纳什均衡。

证明:考虑竞拍者1,固定其估值 v_1。根据策略,竞拍者2的出价 B2 = v_2 / 2,其中 v_2 服从 Uniform(0,1),因此 B2 服从 Uniform(0, 0.5)。竞拍者1出价 b 的期望效用为:

E[utility] = (v_1 - b) * Pr(b > B2) = (v_1 - b) * Pr(b > v_2/2) = (v_1 - b) * min(2b, 1)

b <= 0.5 时,期望效用为 (v_1 - b) * 2b。该函数在 b = v_1 / 2 处取得唯一最大值。证毕。

新的机制设计目标

我们的新目标是:设计简单多项式时间的机制(分配规则 X 和支付规则 P),使得在给定先验下,存在一个贝叶斯纳什均衡,且该均衡能产生接近最优的期望社会福利

我们用以下公式衡量机制 M 在均衡 σ 下的表现:

E_{v ~ F} [ sum_{i} v_i * X_i( σ(v) ) ]

我们希望这个值尽可能接近最优期望社会福利 E_{v~F}[opt(v)]

显示原理

与占优策略情形类似,贝叶斯设定下也有显示原理:如果存在一个机制和它的一个贝叶斯纳什均衡,那么也存在一个直接显示机制,其中“如实报告”本身构成一个贝叶斯纳什均衡,并且两者产生相同的结局分布。

因此,我们可以将注意力限制在直接显示机制上,并专注于研究贝叶斯激励相容 机制。

显示原理的注意事项:应用显示原理可能会破坏原机制的“简单性”。例如,原机制可能通信复杂度很低,但显示原理后的机制却要求报告完整的估值,这违背了设计低通信机制的初衷。因此,在后续讨论中,我们需要谨慎使用显示原理。


单参数问题的实现性

为了构建 BIC 机制,我们首先需要理解:什么样的分配规则 X 是可以被实现的(即存在支付规则 P 使其成为 BIC 机制)?

我们聚焦于单参数问题(例如,每个竞拍者只关心获得多少单位的同质物品)和独立乘积先验

扩展的迈尔森引理

定义临时分配规则 x_i(v_i) 为:当竞拍者 i 报告估值为 v_i,而其他竞拍者的估值根据先验分布随机抽取时,i 获得的期望分配量。

x_i(v_i) = E_{v_{-i} ~ F_{-i}} [ X_i(v_i, v_{-i}) ]

引理:存在支付规则 P 使得直接显示机制 (X, P) 是 BIC 的,当且仅当对于每个竞拍者 i,其临时分配规则 x_i(v_i)非递减的。

这与占优策略下的迈尔森引理类似,但关键区别在于:占优策略要求对每一个固定的 v_{-i},分配量 X_i(v_i, v_{-i}) 关于 v_i 单调;而贝叶斯设定只要求在平均意义下(即临时分配规则)单调。这显然是一个更宽松的条件。

如果临时分配规则单调,那么期望支付也被唯一确定(类似于迈尔森引理中的支付公式):

E_{v_{-i}}[p_i(v_i, v_{-i})] = v_i * x_i(v_i) - ∫_{0}^{v_i} x_i(z) dz

从算法到机制:黑盒归约的梦想

并非所有分配规则都是可实现的。我们的目标是:给定一个针对社会福利最大化问题的 α 近似算法 A(它可能不是单调的),我们能否将其转化为一个具有 α 近似保证且临时分配规则单调的 BIC 机制?

这被称为黑盒归约。理想情况是,存在一个通用的“预处理”步骤,为每个竞拍者设计一个重采样器 R_i,它具有以下性质:

  1. 分布不变:如果输入估值 v_i 来自分布 F_i,则输出 R_i(v_i) 也服从相同的分布 F_i
  2. 福利不降:将原算法 A 应用于重采样后的估值向量,所得的期望社会福利至少不低于直接应用 A 于原始估值的期望社会福利。
  3. 诱导单调性:由新算法 B(v) = A( R_1(v_1), ..., R_n(v_n) ) 诱导出的临时分配规则是单调的。

如果我们能构造这样的重采样器,那么新算法 B 就是一个 α 近似的、具有单调临时分配规则的算法。然后,应用扩展的迈尔森引理,我们就可以为其设计支付规则,从而得到一个 α 近似的 BIC 机制。

热身:离散均匀分布下的重采样器构造

假设每个竞拍者的估值分布 F_i 是离散均匀分布,支持集为 {t_1, t_2, ..., t_M},其中 t_1 < t_2 < ... < t_M

给定原算法 A,我们可以计算每个可能估值 t_j 对应的临时分配概率 x_i(t_j)。如果 A 诱导的临时分配规则已经是单调的,那么无需处理。否则,这些 x_i(t_j) 可能不是按 j 递增的。

我们如下构造重采样器 R_i

  • 将输入估值从小到大排序:t_1, t_2, ..., t_M
  • 将对应的临时分配概率 x_i(t_1), x_i(t_2), ..., x_i(t_M) 也从小到大排序。
  • 定义 R_i(t_j) 为:使得 x_i(t_k) 是排序后列表中第 j 小的那个估值 t_k

性质分析:

  1. 分布不变R_i 是定义在支持集上的一个双射(完美匹配),因此输出分布仍是均匀的。
  2. 诱导单调性:由构造可知,新算法 B 的临时分配规则现在是单调的。因为我们将第 j 低的估值映射到了第 j 低的分配概率。
  3. 福利不降:这本质上是一个匹配问题。为了最大化 Σ v_i * x_i,根据重排不等式,将较高的估值与较高的分配概率相匹配能获得更大的和。我们的构造正是这样做的,因此期望社会福利不会下降。

这个简单的例子说明了重采样器构造的核心思想:通过巧妙地重新映射估值报告,来“修正”原算法分配规则中的非单调性,同时保持或提升社会福利。

遗留问题与扩展:

  1. 计算临时分配概率:我们需要能够(高效地)估算 x_i(v_i) = E_{v_{-i}}[X_i(v_i, v_{-i})],这通常需要通过抽样等技术来近似。
  2. 扩展到一般分布:如何将构造推广到非均匀的离散分布或连续分布?
  3. 扩展到多参数问题:单参数的构造思想能否推广到更复杂的多参数设定?

这些将是下一讲讨论的重点。


总结

本节课中,我们一起学习了:

  1. 收缩机制的近似比证明:通过引理2和引理3,分析了在弱行为假设下,收缩机制能以 D * log^2(V_max) 的近似比实现社会福利。
  2. 贝叶斯激励相容性基础:引入了先验信念和贝叶斯纳什均衡的概念,明确了新的机制设计目标——设计具有良好贝叶斯均衡的简单机制。
  3. 单参数BIC机制的可实现性:通过扩展的迈尔森引理,理解了临时分配规则单调是BIC机制存在的充要条件。
  4. 黑盒归约的愿景:提出了通过构造“重采样器”将任意近似算法转化为单调算法,进而得到BIC机制的框架,并通过离散均匀分布的例子展示了其可行性。

这为我们在更宽松的激励相容概念下设计性能优良的机制提供了强大的理论工具和清晰的路径。下一讲我们将深入探讨如何实现更一般的黑盒归约。

013:黑盒归约

在本节课中,我们将学习如何将一个计算高效的近似算法,转化为一个贝叶斯激励兼容的机制。我们将通过一种称为“黑盒归约”的技术来实现这一目标,该技术能保留原算法的近似保证,同时解决其激励问题。

上一节我们介绍了贝叶斯纳什均衡的概念。本节中,我们来看看如何利用线性规划和互补松弛条件,为任意近似算法构建激励兼容的机制。

目标与蓝图

我们的目标如下:

  • 设计简单、多项式时间的机制。
  • 在多项式时间内,使社会福利尽可能接近最优。
  • 机制是贝叶斯激励兼容的。

贝叶斯激励兼容 意味着直接显示(如实报告自己的估值)构成一个贝叶斯纳什均衡。用公式表示,对于每个竞拍者 i 及其真实估值 v_i,直接显示应最大化其期望效用:

E_{v_{-i} ~ F_{-i}} [u_i(v_i, (v_i, v_{-i}))] >= E_{v_{-i} ~ F_{-i}} [u_i(v_i, (b_i, v_{-i}))] 对所有可能的报告 b_i 成立。

其中,F_{-i} 是其他竞拍者估值的先验分布(假设为独立分布),其他竞拍者均采用直接显示策略。

黑盒归约 的蓝图如下:

  1. 给定一个算法 A,它具有良好的近似比,但可能不满足激励兼容性。
  2. 我们设计一个新算法 B,其形式为 B = A ◦ R
  3. R 是一个“重采样器”子程序,它在将估值输入算法 A 之前,先对其进行预处理(重映射)。
  4. 目标是:算法 B 是贝叶斯激励兼容的,并且其期望社会福利至少与算法 A 一样好。

核心构造:重采样器与支付规则

为了实现上述目标,我们需要为每个竞拍者 i 独立地设计两个部分:重采样器 R_i 和支付规则 P_i。我们将通过求解一个线性规划及其对偶问题来同时得到它们。

问题设置

假设每个竞拍者 i 有一个有限的可能估值(类型)集合 T_i,并且已知其先验概率分布 F_i。算法 A 接收一个估值剖面(类型剖面),并输出一个分配方案。

线性规划公式化

我们为单个竞拍者 i 构建一个二分图模型:

  • 左侧节点:代表真实的类型 s ∈ T_i
  • 右侧节点:代表重采样后(即报告给算法 A)的类型 t ∈ T_i

决策变量 x_{s,t}:表示真实类型为 s 的竞拍者被重采样为类型 t 的联合概率。

约束条件

  1. 流守恒(左侧):对于每个真实类型 s,流出流量等于其先验概率。
    ∑_{t ∈ T_i} x_{s,t} = F_i(s)  对所有 s ∈ T_i 成立。
    
  2. 分布保持(右侧):对于每个重采样类型 t,流入流量应等于其先验概率。这确保了重采样后的输出分布与输入分布相同。
    ∑_{s ∈ T_i} x_{s,t} = F_i(t)  对所有 t ∈ T_i 成立。
    

目标函数:我们最大化竞拍者 i 的期望效用。

最大化 ∑_{s,t ∈ T_i} x_{s,t} * w_{s,t}

其中,权重 w_{s,t} 定义为:当竞拍者 i 的真实类型为 s,但向算法 A 报告类型 t,而其他竞拍者均真实报告时,竞拍者 i 所获得的期望(社会福利)效用。公式为:

w_{s,t} = E_{v_{-i} ~ F_{-i}} [v_i(s, A(t, v_{-i}))]

这里 A(t, v_{-i}) 表示算法 A 在输入 (t, v_{-i}) 下产生的分配,v_i(s, ·) 表示用真实类型 s 来评估该分配的价值。

对偶与互补松弛条件

该线性规划的对偶问题包含对偶变量 p_t(对应于每个右侧节点 t 的约束)。根据互补松弛条件,对于一个最优的原问题解 x* 和对偶问题解 p*,有:

关键性质:只有当类型 t 是真实类型 s 在现行“价格” p* 下的最优选择时,才有 x*_{s,t} > 0。即:

如果 x*_{s,t} > 0,则 t ∈ argmax_{z ∈ T_i} [w_{s,z} - p*_z]。

这意味着,在最优解中,真实类型 s 只会被重采样到那些能最大化其(期望效用 - 支付)的声明类型 t

构建机制

基于最优解 (x*, p*),我们构建机制:

  1. 重采样器 R_i:当竞拍者 i 报告其真实类型为 s 时,R_i 以概率 x*_{s,t} / F_i(s) 输出类型 t
  2. 支付规则 P_i:设计支付规则,使得当竞拍者 i 声明类型为 t 时,其期望支付恰好等于对偶变量 p*_t。即:
    E_{v_{-i}} [P_i(t, v_{-i})] = p*_t。
    

激励兼容性分析

现在,我们证明这样构造的机制是贝叶斯激励兼容的。

根据互补松弛条件,对于竞拍者 i 的任何真实类型 s,重采样器 R_i 只会将其映射到那些能最大化 (w_{s,z} - p*_z) 的类型 t。而 w_{s,t} - p*_t 恰好是当竞拍者真实类型为 s、报告类型为 t、且其他竞拍者真实报告时,竞拍者 i 的净期望效用(期望价值减去期望支付)。

因此,无论竞拍者 i 的真实类型 s 是什么,诚实地报告 s 并交由重采样器 R_i 处理,总能导致一个能最大化其净期望效用的声明被输入算法 A。任何主动的误报策略都无法超越这一结果,因为重采样器已经自动为其选择了最优的“谎言”。所以,直接显示是竞拍者 i 的最优反应。

此外,由于每个竞拍者的重采样器 R_i 都满足分布保持性质,即不改变其他竞拍者所看到的估值分布 F_{-i},因此每个竞拍者在推理时,其关于其他竞拍者估值的信念保持不变。这意味着,当所有其他竞拍者都诚实报告时,每个竞拍者诚实报告都是最优的,从而构成了一个贝叶斯纳什均衡。

社会福利分析

接下来,我们分析新算法 B 的社会福利。

竞拍者 i 在机制 B 中的期望贡献为:

E_{s,t,v_{-i}} [v_i(s, A(t, R_{-i}(v_{-i})))] = ∑_{s,t} x*_{s,t} * w_{s,t}

由于重采样器 R_{-i} 是分布保持的,期望值中的 R_{-i}(v_{-i}) 可以替换为 v_{-i},因此结果等于线性规划的目标函数值。

而在原算法 A 中(即无重采样,直接输入真实估值),竞拍者 i 的期望贡献为:

E_{s,v_{-i}} [v_i(s, A(s, v_{-i}))] = ∑_{s} F_i(s) * w_{s,s}

这相当于在原线性规划中取一个特解:x_{s,t} = F_i(s)s=t,否则为 0。显然,这个特解是可行的。

由于 x* 是线性规划的最优解,其目标函数值不小于任何可行解(包括这个特解)的目标函数值。因此,我们有:

算法 B 的期望社会福利 >= 算法 A 的期望社会福利。

这表明,我们的归约不仅解决了激励问题,而且不会降低社会福利的期望值。

总结与讨论

本节课中我们一起学习了“黑盒归约”这一强大技术。其核心思想是:对于任何具有独立先验估值分布、且存在有限类型空间的场景,给定一个多项式时间的近似算法,我们都可以构造一个多项式时间的贝叶斯激励兼容机制,该机制的社会福利近似比至少与原算法相同。

我们通过以下步骤实现了这一归约:

  1. 为每个竞拍者独立地建立一个将真实类型映射到报告类型的“重采样”线性规划模型。
  2. 该模型的目标是最大化竞拍者的期望效用,并约束重采样过程保持估值分布不变。
  3. 通过求解线性规划及其对偶,我们同时得到了重采样策略和隐含的支付价格。
  4. 利用互补松弛条件,我们直接证明了由此构造的机制是贝叶斯激励兼容的。
  5. 通过比较线性规划的最优解与代表原算法的可行解,我们证明了新机制的社会福利不会下降。

主要优势:该结果非常通用,为许多组合拍卖问题(如次模估值)提供了通向贝叶斯激励兼容机制的途径,而这在占优策略激励兼容性下通常非常困难甚至不可能。

局限性:该方法的计算复杂度依赖于类型空间的大小。当类型空间呈指数级增长时(例如,在有多个物品的加法估值中),直接应用此方法可能计算上不可行。如何为具有简洁描述的大型或连续类型空间设计高效归约,是一个重要的开放研究方向。

下一讲,我们将探讨如何设计更简单、更实用的近似机制。

014:简单拍卖的无政府状态代价

在本节课中,我们将学习简单拍卖的无政府状态代价。我们将探讨一种非常简单的拍卖形式——同时进行的第二价格拍卖,并分析其均衡的效率。尽管这种拍卖形式简单,且参与者可能拥有复杂的估值函数,但我们能够证明,在满足“无过高出价”条件的均衡下,其社会福利至少能达到最优社会福利的一半。


课程概述:第四部分:简单拍卖的无政府状态代价

本课程第四部分将聚焦于简单拍卖的无政府状态代价。这是近年来计算机科学领域机制设计研究的热点之一,我们将涵盖一些近几个月的最新成果。

这部分内容的动机源于我们之前提出的三个标准:激励保证、性能保证和可处理性保证。在连续几周的理论构造之后,我们现在将回归简单性。在本部分中,我们将坚持拍卖的简单性,无论其代价如何。

当我们说一个拍卖“简单”时,我们指的是它易于描述和实现。这并不意味着参与者易于参与。与直接显示机制不同,在这些拍卖中,参与者如何出价并不明确,均衡也不易求解。然而,与上学期无政府状态代价的结果类似,我们能够证明,无论均衡是什么,它们都是接近最优的。

因此,我们追求的是具有接近最优均衡的简单拍卖。今天,我们将讨论纯纳什均衡;下周,我们将转向贝叶斯纳什均衡。


场景设定:具有次模估值的分配问题

我们回到一个熟悉的场景:一个分配问题,其中包含 M 个不同的物品,每个竞拍者 i 拥有一个次模估值函数 V_i。次模意味着边际收益递减:将一个物品添加到一个更大的集合中,其边际价值小于将其添加到一个更小的集合中。

这是一个我们多次遇到的场景。之前,我们考虑如何将这些估值作为输入提供。但今天,我们更关注的是存在竞拍者,并且我们期望能够向他们提出需求查询。

在没有激励问题的情况下,我们知道如何获得常数近似解;通过复杂的机制,我们也知道如何获得常数近似解。但对于这种设置,我们不知道好的直接显示机制,只针对像覆盖函数这样的特殊情况。

那么,如果我们放弃设计复杂的合成直接显示机制,转而简单地在 eBay 上分别出售这些物品,结果会如何?我们能否通过数学分析来判断这是灾难性的还是可以接受的?这就是本讲的核心问题。


建模:同时进行的第二价格拍卖

我们如何建模在 eBay 上分别出售 M 个物品?我们将其建模为同时进行的第二价格拍卖

每个竞拍者 i 为每个物品 j 提交一个出价 B_ij。这与我们之前看到的大多数拍卖形式截然不同。竞拍者拥有任意的次模估值,有 2^M 种可能的物品组合,但只能表达 M 个数字(每个物品一个出价),尽管其类型空间(估值)要大得多。因此,谈论直接显示机制在这里没有意义。

处理这些出价的方式是:对每个物品单独运行一个维克瑞拍卖。每个物品出售给出价最高者,获胜者支付第二高出价。

我们的目标是理解这种拍卖的性能:其均衡有多好?今天,我们保持简单,仅讨论纯纳什均衡。


问题与条件:无过高出价均衡

在分析第二价格拍卖的均衡时,存在一个问题:可能存在因“虚张声势”导致的过高出价均衡。例如,在一个两竞拍者单物品拍卖中,如果第二个竞拍者出价极高(虚张声势),而第一个竞拍者因害怕而放弃出价,这可能构成一个纳什均衡,但社会福利极差。

为了避免这种不合理的均衡,我们将聚焦于无过高出价的均衡。这意味着,对于每个竞拍者 i,其在其赢得的物品集合 S_i(B) 上的总出价,不超过其对该集合的估值 V_i(S_i(B))。

有两种方式处理过高出价:一是直接限制策略空间,禁止过高出价;二是允许所有出价,但只对那些满足无过高出价条件的均衡给出性能保证。今天的分析对两种方式都适用。


性能极限:一个简单例子

即使在无过高出价条件下,我们也无法期望均衡达到完全最优。以下例子表明,我们最多只能达到最优社会福利的 50%。

考虑两个竞拍者和两个物品 X 和 Y。两个竞拍者都是单位需求估值:

  • 竞拍者 1:对 X 的估值为 2,对 Y 的估值为 1。
  • 竞拍者 2:对 Y 的估值为 2,对 X 的估值为 1。

最优分配是:X 给 1,Y 给 2,社会福利为 4。

然而,存在一个纯纳什均衡(且无过高出价):

  • 竞拍者 1:对 X 出价 0,对 Y 出价 1。
  • 竞拍者 2:对 Y 出价 0,对 X 出价 1。
    结果:竞拍者 1 赢得 Y(支付 0),竞拍者 2 赢得 X(支付 0)。双方效用均为 1,且没有单边偏离动机。此时社会福利仅为 2,是最优值的一半。

这个例子表明,50% 是我们可能证明的最佳界限。


主要定理:CKS 定理

Christodoulou, Kovacs 和 Shapira 的定理指出:

如果所有竞拍者都具有次模估值函数,并且 B 是一个满足无过高出价条件的纯纳什均衡,那么均衡 B 的社会福利至少是最优社会福利的 50%。

这个简单的两竞拍者、两物品、单位需求的例子,正是同时第二价格拍卖中无过高出价均衡的最坏情况。

值得注意的是,我们目前不知道有任何直接显示机制能达到接近此保证的性能。此外,在这些博弈中,纯纳什均衡总是存在的。

接下来的内容将致力于证明这个定理。


证明热身:单位需求竞拍者

我们首先证明定理的一个特例:所有竞拍者都是单位需求估值。单位需求是次模的一个特例,且上述 50% 的例子也适用于此,所以这已经是能证明的最佳界限。

证明步骤:

  1. 设定与符号

    • 设 B 为满足无过高出价条件的纯纳什均衡。
    • S_i(B) 为竞拍者 i 在均衡中赢得的物品集合(对单位需求者,最多一个物品)。
    • p_j 为物品 j 的价格(第二高出价)。
    • J*(i) 为竞拍者 i 在最优分配中获得的物品(可能为空)。
  2. 利用均衡条件构造偏离
    对于每个竞拍者 i,考虑一个假设的偏离出价向量 B*_i:它只对最优分配中应得的物品 J*(i) 出价 V_i(J*(i)),对其他所有物品出价 0。这模拟了竞拍者 i “全力争夺”其最优物品。
    由于 B 是纯纳什均衡,竞拍者 i 采用均衡策略 B_i 的效用,不低于采用偏离策略 B*_i 的效用。

  3. 推导不等式
    竞拍者 i 在均衡中的效用是:V_i(S_i(B)) - sum_{j in S_i(B)} p_j
    偏离后的效用至少是:V_i(J*(i)) - max_{k ≠ i} B_{k, J*(i)}(如果赢得物品)或 0(如果输掉物品)。无论如何,我们可以得到下界:
    V_i(S_i(B)) ≥ V_i(J*(i)) - max_{k} B_{k, J*(i)}
    (我们简化了 max 的范围,使右边更小,不等式仍然成立)。

  4. 对所有竞拍者求和
    对 i 求和:

    • 左边:sum_i V_i(S_i(B)) 正是均衡社会福利 Welfare(B)
    • 右边第一项:sum_i V_i(J*(i)) 正是最优社会福利 OPT
    • 右边第二项(误差项):- sum_i max_k B_{k, J*(i)}
  5. 处理误差项
    我们想给误差项一个上界。我们改变求和顺序,按均衡中赢得的物品来求和:
    sum_i max_k B_{k, J*(i)} ≤ sum_i sum_{j in S_i(B)} max_k B_{k, j}
    对于竞拍者 i 在均衡中赢得的物品 j,最高出价就是 i 自己的出价 B_{ij}。因此:
    sum_i sum_{j in S_i(B)} max_k B_{k, j} = sum_i sum_{j in S_i(B)} B_{ij}
    根据无过高出价条件,对于每个 i,sum_{j in S_i(B)} B_{ij} ≤ V_i(S_i(B))
    因此,误差项的上界是 sum_i V_i(S_i(B)) = Welfare(B)

  6. 完成证明
    将第 4 步和第 5 步结合,我们得到:
    Welfare(B) ≥ OPT - Welfare(B)
    整理得:2 * Welfare(B) ≥ OPT,即 Welfare(B) ≥ OPT / 2

证明思路总结
这个证明模板是典型的无政府状态代价分析步骤:

  1. 利用均衡条件,为每个参与者构造一个特定的偏离。
  2. 为每个参与者推导出一个将其(均衡)贡献与最优贡献联系起来的不等式。
  3. 对所有参与者求和,得到总福利关系,但会引入一个“纠缠”的误差项。
  4. 利用问题的特定结构(此处是无过高出价条件)来界定误差项。
  5. 通过代数整理得到最终的性能比界限。

扩展到次模估值:关键引理

现在,我们将证明扩展到竞拍者具有一般次模估值的情况。主要障碍在于第一步:如何为拥有一个物品束(而非单个物品)的竞拍者构造偏离出价向量?

我们需要一个关于次模估值的关键引理:

引理:每一个单调次模估值函数 V,都可以表示为一系列可加估值函数的最大值
即,存在一组可加估值函数 {A^1, A^2, ..., A^R}(每个是 M 维向量),使得对于任意物品束 S,有:
V(S) = max_{r} sum_{j in S} A^r_j

直观理解

  • 可加估值:对物品束的估值等于各物品单独估值之和。
  • 单位需求估值是特例:每个可加函数 A^r 只在某一个物品上有正值,其他为 0。取最大值就得到了“只对最喜欢物品估值”的效果。
  • 次模估值是“最大可加估值”的一个子类。反之则不成立(最大可加估值类比次模更广)。

引理证明概要
构造是直接的。考虑所有 M! 种物品排列顺序 π。对于每种排列 π,我们定义一个可加估值 A^π:对于物品 j,令 A^π_j 等于将物品 j 添加到其之前所有物品(按排列 π)的集合中时带来的边际价值。
可以证明:

  1. 对于任意物品束 S,存在一种排列(将 S 中物品排在最前面),使得 sum_{j in S} A^π_j = V(S)
  2. 对于其他任意排列,由于次模性(边际价值递减),sum_{j in S} A^π_j ≤ V(S)
    因此,V(S) 等于所有 A^π 在 S 上估值的最大值。

这个表示法的妙处在于:对于特定的物品束 S*,我们可以找到一个可加函数 A*,使得 V(S*) = sum_{j in S*} A*_j。而对于其他任意物品束 T,有 sum_{j in T} A*_j ≤ V(T)。这意味着,对于分析中我们关心的那个特定最优物品束,我们可以“假装”估值是可加的,这不会高估其价值。


证明一般情况:CKS 定理完整证明

现在,我们利用上述引理来完成一般次模估值下的证明。

  1. 设定与符号:同前。设 S*_i 为竞拍者 i 在最优分配中获得的物品束。

  2. 构造偏离(关键步骤):
    根据引理,对于每个竞拍者 i 及其最优物品束 S*_i,我们可以选择一个可加估值函数 A*_i,使得:

    • V_i(S*_i) = sum_{j in S*_i} A*_{i,j}
    • 对于任意其他物品束 T,sum_{j in T} A*_{i,j} ≤ V_i(T)
      我们定义竞拍者 i 的偏离出价向量 B*_i 为:
    • 对于 j ∈ S*_iB*_{i,j} = A*_{i,j}
    • 对于 j ∉ S*_iB*_{i,j} = 0
      这模拟了竞拍者 i 按照“分解”后的个人估值,全力争夺其最优物品束中的每个物品。
  3. 应用均衡条件
    由于 B 是纯纳什均衡,竞拍者 i 的均衡效用不低于偏离效用:
    V_i(S_i(B)) - sum_{j in S_i(B)} p_j ≥ [效用(B*_i)]

  4. 分析偏离效用
    偏离后,竞拍者 i 只对 S*_i 中的物品出价。因此,其偏离效用可以分解为对 S*_i 中每个物品 j 的贡献:

    • 如果 A*_{i,j} > max_{k} B_{k,j},则 i 赢得物品 j,获得价值 A*_{i,j},支付 max_{k} B_{k,j}
    • 否则,i 未赢得 j,贡献为 0。
      无论哪种情况,物品 j 对效用的贡献都至少为 A*_{i,j} - max_{k} B_{k,j}(因为第二种情况贡献 0 ≥ 这个差值的负数)。因此,总偏离效用至少为:
      sum_{j in S*_i} (A*_{i,j} - max_{k} B_{k,j})
  5. 推导不等式
    结合步骤 3 和 4,并忽略均衡中的支付项(使左边更大),我们得到:
    V_i(S_i(B)) ≥ sum_{j in S*_i} A*_{i,j} - sum_{j in S*_i} max_{k} B_{k,j}
    根据 A*_i 的构造性质,sum_{j in S*_i} A*_{i,j} = V_i(S*_i)。所以:
    V_i(S_i(B)) ≥ V_i(S*_i) - sum_{j in S*_i} max_{k} B_{k,j}

  6. 求和与处理误差项
    对所有 i 求和:

    • 左边:sum_i V_i(S_i(B)) = Welfare(B)
    • 右边第一项:sum_i V_i(S*_i) = OPT
    • 右边第二项(误差项):- sum_i sum_{j in S*_i} max_{k} B_{k,j}
      与单位需求情况类似,我们改变求和顺序,按均衡中赢得的物品求和:
      sum_i sum_{j in S*_i} max_{k} B_{k,j} ≤ sum_i sum_{j in S_i(B)} max_{k} B_{k,j}
      对于 i 在均衡中赢得的物品 j,max_{k} B_{k,j} = B_{ij}。因此:
      sum_i sum_{j in S_i(B)} B_{ij} ≤ sum_i V_i(S_i(B)) = Welfare(B)。这里用到了无过高出价条件。
  7. 完成证明
    代入得到:Welfare(B) ≥ OPT - Welfare(B),即 Welfare(B) ≥ OPT / 2


总结与展望

在本节课中,我们一起学习了:

  1. 问题设定:分析了在 eBay 上分别出售物品(同时第二价格拍卖)这一简单格式。
  2. 均衡概念:聚焦于满足“无过高出价”条件的纯纳什均衡,以排除不合理的虚张声势均衡。
  3. 性能极限:通过一个单位需求的例子,证明了即使是最好的均衡,其社会福利也可能只达到最优值的 50%。
  4. 核心定理:证明了 CKS 定理——对于具有次模估值的竞拍者,同时第二价格拍卖的任何无过高出价纯纳什均衡,都能保证至少 50% 的社会福利。
  5. 证明方法
    • 利用均衡条件,为每个竞拍者构造一个针对其最优物品束的偏离出价。
    • 关键技巧是使用“次模估值可表示为最大可加估值”的引理,来合理构造这个偏离。
    • 通过对所有竞拍者求和,并利用无过高出价条件控制误差项,最终推导出 1/2 的近似比。

这个结果的意义在于,它表明极其简单的拍卖格式,在均衡中也能自动实现相当好的社会效率,尽管我们可能并不知道均衡具体是什么,参与者也可能拥有非常复杂的估值。

展望未来
我们将在接下来的几讲中继续深入:

  1. 更多拍卖格式:分析除同时第二价格拍卖外的其他简单格式。
  2. 更一般的估值:将结果扩展到次模之外更广泛的估值类别。
  3. 更合理的均衡概念:纯纳什均衡在拍卖中假设了完全信息,并不完全现实。下一讲,我们将把这种分析扩展到更贴合拍卖背景的贝叶斯纳什均衡,证明类似的性能保证。

本节课中我们一起学习了:如何分析简单同时拍卖的无政府状态代价,掌握了通过构造偏离和利用估值结构来证明均衡性能保证的核心证明模板,并理解了即使在复杂估值下,简单机制也可能通过分散的均衡实现良好的整体效率。

015:贝叶斯纳什均衡的无政府状态价格

在本节课中,我们将要学习如何分析简单拍卖格式在贝叶斯纳什均衡下的表现。我们将重点关注同时进行的次价拍卖,并探讨其社会福利的近似保证。课程将首先回顾上一讲关于纯纳什均衡的结论,然后引入贝叶斯纳什均衡这一更贴合拍卖实际的不完全信息均衡概念,并证明其在独立估值分布下的性能保证。


回顾:纯纳什均衡下的性能

上一节我们介绍了我们的第一个简单拍卖格式:同时次价拍卖。在这个拍卖中,每个竞拍者为M件商品中的每一件提交一个出价,每件商品独立地以次高价卖给最高出价者。我们证明了在特定条件下,这种简单拍卖的纯纳什均衡能实现至少一半的最优社会福利。

我们做了两个关键假设:

  1. 估值假设:竞拍者具有XOS估值(或分数次可加估值),这是比次模估值更一般的类别。一个次模估值可以表示为一系列可加估值的最大值。
  2. 均衡假设:我们只考虑“无过高出价”的纯纳什均衡。具体来说,对于任意竞拍者,其赢得的所有商品的出价总和不超过其对这些商品的实际估值。

在这些假设下,我们证明了以下结论:

  • 纯纳什均衡的社会福利至少是最优社会福利的 1/2
  • 这个因子 1/2 是紧的,存在一个例子(两个竞拍者,两件商品,单位需求估值)使得均衡社会福利恰好是最优的一半。

证明的核心步骤是构造一个假设的偏离策略。对于每个竞拍者i,我们查看其在最优分配中赢得的商品,然后让其“全力出价”竞拍这些商品(即,对这些商品的出价等于其XOS表示中对应的可加估值分量,对其他商品出价为0)。利用均衡条件(即偏离不会带来更高收益)和“无过高出价”条件,我们最终推导出社会福利的下界。


迈向贝叶斯纳什均衡

然而,纯纳什均衡是一个完全信息概念,它假设所有竞拍者都知道彼此的估值。在实际拍卖中,竞拍者通常不知道他人的支付意愿。因此,更合适的均衡概念是 贝叶斯纳什均衡,它建模了这种不完全信息。

我们希望将性能保证从纯纳什均衡扩展到贝叶斯纳什均衡。回顾上学期(CS364A)关于“无政府状态价格”的内容,我们曾学习过“扩展定理”。其核心思想是:如果我们能针对纯纳什均衡证明一个符合特定模板(即“平滑性”)的POA界,那么这个界通常可以自动扩展到混合均衡、相关均衡等更广泛的均衡概念上。

我们上一讲对同时次价拍卖的证明恰好符合这个模板:

  • 均衡假设使用方式:仅在证明中用于对每个玩家应用一次均衡条件(即,其均衡效用不低于切换到某个特定偏离策略的效用)。
  • 偏离策略构造:偏离策略 B_i* 的构造仅依赖于估值剖面 V,而不依赖于当前的均衡出价向量 B

这意味着,从技术上讲,我们上一讲的证明表明,在“无过高出价”的条件下,这个拍卖游戏是 (1,1)-平滑 的。因此,上学期关于混合均衡、相关均衡的扩展定理可以直接应用,我们得到相同的 1/2 近似比保证。

但这仍然是在完全信息博弈框架下的结论。我们真正需要的是针对贝叶斯纳什均衡的扩展定理。接下来,我们将展示如何实现这一点。


贝叶斯纳什均衡的无政府状态价格

为了定义贝叶斯纳什均衡的无政府状态价格,我们需要指定一个先验分布 F。均衡和最优福利都是在估值从 F 中随机抽取的期望意义下定义的。

定义

  • 最优期望福利E_{V~F}[OPT(V)],即对所有可能估值剖面取最优社会福利的期望。
  • 最差贝叶斯纳什均衡的期望福利:考虑所有满足特定条件(如无过高出价)的贝叶斯纳什均衡策略组合 σ,取其中期望福利最小的那个。
  • 贝叶斯纳什均衡的无政府状态价格:上述两者之比的最大可能值(即最坏情况下的效率损失比)。

一个自然的问题是:这个比值对于什么样的先验分布 F 是良好的?我们希望结论尽可能广泛。


负面结果:相关分布可能导致极差性能

首先,我们展示一个负面结果:如果估值分布 F相关的,那么贝叶斯纳什均衡的无政府状态价格可以非常差,远劣于因子2。

构造示例

  • 设定:有 n 个竞拍者和 n + √n - 1 件商品。竞拍者具有单位需求估值,对每件商品的估值非0即1。
  • 估值分布 F(相关)
    1. 随机选择 √n 件商品作为“公共商品”,所有竞拍者都想要(估值1)。
    2. 剩下的 n 件商品是“特殊商品”。将竞拍者与这些特殊商品随机配对,每个竞拍者只想要与其配对的唯一一件特殊商品(估值1),不想要其他特殊商品。
  • 机制:同时次价拍卖,每件商品设有保留价 1/n^{1/6}(可通过虚拟竞拍者模拟)。
  • 分析
    • 最优福利:总是 n(通过将每个竞拍者分配其配对的特殊商品即可实现)。
    • 均衡行为:由于估值相关,每个竞拍者知道自己想要 √n 件商品(√n-1 件公共商品和1件特殊商品),但无法从这 √n 件商品中识别出哪一件是专属于自己的特殊商品(所有商品看起来对称)。
    • 在均衡中,竞拍者为了避免以高概率赢得过多商品并支付高昂保留价,其策略会限制自己赢得商品的数量。通过对称性论证,每个竞拍者赢得其特殊商品的概率极低(约为 1/n^{1/6})。
    • 均衡期望福利:主要来自公共商品的分配(最多 √n),加上竞拍者偶尔赢得特殊商品的贡献。总福利约为 O(n^{5/6})
  • 结论:贝叶斯纳什均衡的无政府状态价格至少为 Ω(n^{1/6}),是 n 的多项式函数,远劣于常数因子2。

这个例子表明,对于任意的相关分布,我们无法得到良好的常数近似保证。


正面结果:独立(乘积)分布下的性能保证

那么,对于独立(乘积)分布呢?我们有一个积极的结论。

定理:对于同时次价拍卖,如果竞拍者的估值从乘积分布 F = F1 × ... × Fn 中独立抽取,并且贝叶斯纳什均衡 σ 满足一个“平均意义上的无过高出价”条件(稍后精确定义),那么该均衡的期望社会福利至少是最优期望社会福利的 1/2

证明思路(“替身技巧”)
我们已知在完全信息下,对于任意估值剖面 V 和任意出价向量 B,存在一组偏离出价 B_i*(V),使得以下“平滑性不等式”成立(这是上一讲证明的核心):

∑_i u_i(B_i*(V), B_-i) ≥ OPT(V) - ∑_i ∑_{j in S_i(B)} b_{ij}

其中 S_i(B) 是竞拍者 i 在出价剖面 B 下赢得的商品集合。

现在考虑一个贝叶斯纳什均衡 σ。对于竞拍者 i,我们想利用均衡条件来下界其期望效用。自然的想法是让其偏离到 B_i*(V),但问题在于 B_i* 依赖于整个估值剖面 V,而竞拍者 i 只知道自己的估值 v_i,不知道他人的 v_{-i}

“替身技巧” 解决了这个问题:

  1. 竞拍者 i 的偏离策略 σ_i* 如下:在得知自己的真实类型 v_i 后,从先验分布 F 中独立地抽样生成一个“替身”类型剖面 W = (w_i, w_{-i})。注意,这里 w_i 是从 F_i 中新抽的,可能不同于 v_i
  2. 然后,竞拍者 i 计算出价 B_i*(v_i, w_{-i}) 并执行它。即,它使用自己的真实估值 v_i 和替身他人的估值 w_{-i} 来构造偏离出价。

这个偏离策略是良定义的,因为竞拍者 i 知道先验分布 F 从而可以抽样。由于 σ 是贝叶斯纳什均衡,竞拍者 i 采用 σ_i* 的期望效用不会高于其坚持均衡策略 σ_i 的期望效用。

推导过程

  1. 对每个竞拍者 i,写出其均衡效用下界:E[u_i(σ)] ≥ E[u_i(σ_i*, σ_{-i})]
  2. σ_i* 的定义代入右边,得到涉及对真实类型 V 和替身类型 W 取期望的表达式。
  3. 关键步骤:由于分布是乘积的,我们可以交换和混合不同类型变量。特别地,我们可以将表达式中的真实类型变量 v_i 替换为替身类型变量 w_i,而不改变期望值。这一步在相关分布下不成立。
  4. 将所有竞拍者的不等式求和,并将求和号移入期望内。
  5. 此时,期望内部的表达式恰好具有我们已知的“平滑性不等式”的形式,只是应用于替身类型剖面 W 和均衡出价(对应于 σ(V))。应用该不等式,我们得到:
    ∑_i E[u_i(σ)] ≥ E[OPT(W)] - E[∑_i ∑_{j in S_i(σ(V))} σ_i(v_i)_j]
    
    其中 σ_i(v_i)_j 是竞拍者 i 在均衡策略下对商品 j 的出价。
  6. 化简:
    • E[OPT(W)] = E[OPT(V)],因为 WV 同分布。
    • 令误差项 Error = E[∑_i ∑_{j in S_i(σ(V))} σ_i(v_i)_j],即均衡中所有竞拍者在其赢得商品上的出价总和的期望。
  7. 由于效用是价值减去支付,均衡期望福利 E[Welfare(σ)] 大于等于总期望效用 ∑_i E[u_i(σ)]
  8. 因此,E[Welfare(σ)] ≥ E[OPT(V)] - Error

“平均无过高出价”条件
为了得到因子2的界,我们需要控制误差项 Error。我们要求均衡策略 σ 满足:

对于每个竞拍者 i, E[∑_{j in S_i(σ(V))} σ_i(v_i)_j] ≤ E[v_i(S_i(σ(V)))]

即,每个竞拍者在其赢得商品上的出价总和的期望,不超过其从这些商品中获得价值的期望。这是一个在期望意义上成立的“无过高出价”条件,比逐实例成立的条件更弱。

在此条件下,Error ≤ E[Welfare(σ)]。代入不等式 E[Welfare(σ)] ≥ E[OPT(V)] - Error,得到 2 * E[Welfare(σ)] ≥ E[OPT(V)],即 E[Welfare(σ)] ≥ (1/2) * E[OPT(V)]

证毕

这个证明本质上是将完全信息下的平滑性证明,通过“替身技巧”和独立分布的性质,扩展到了贝叶斯纳什均衡。它是一个通用的扩展定理原型。


总结

本节课中我们一起学习了:

  1. 回顾:同时次价拍卖在纯纳什均衡和“无过高出价”条件下,能实现至少 1/2 的最优社会福利。
  2. 均衡概念扩展:我们指出该证明满足“平滑性”模板,因此其性能保证可自动扩展到完全信息下的混合均衡、相关均衡等。
  3. 贝叶斯纳什均衡的挑战与定义:我们引入了更贴合实际的不完全信息均衡概念——贝叶斯纳什均衡,并定义了其在先验分布下的无政府状态价格。
  4. 负面结果:我们构造了一个相关估值分布的例子,表明贝叶斯纳什均衡的无政府状态价格可以非常差(多项式级别),因此常数近似保证不可能适用于所有相关分布。
  5. 正面结果:对于独立(乘积)估值分布,我们证明了同时次价拍卖的贝叶斯纳什均衡(满足平均无过高出价条件)仍然能实现至少 1/2 的期望社会福利。证明的核心是巧妙的 “替身技巧”

本节课的核心结论是:虽然简单的同时次价拍卖在独立私人估值模型下具有良好的理论保证(即使在贝叶斯纳什均衡下),但估值之间的相关性可能严重破坏其效率。这指引我们在机制设计中选择模型和进行分析时需要仔细考虑信息结构的假设。

016:一价拍卖的无政府状态价格

在本节课中,我们将学习一价拍卖的无政府状态价格。我们将从单物品一价拍卖的基础开始,逐步扩展到多物品同时一价拍卖,并学习如何利用平滑性不等式和扩展定理来分析贝叶斯纳什均衡下的社会福利损失。


单物品一价拍卖基础

上一节我们介绍了同时二价拍卖的无政府状态价格。本节中,我们来看看一价拍卖。在一价拍卖中,赢家支付自己的出价,而不是第二高出价。我们之前讨论较少,主要是因为一价拍卖不满足像二价拍卖那样的强激励相容性保证。

然而,在同时拍卖的复杂环境中,一价规则可能和二价规则一样易于分析,甚至更简单。实际上,我们将看到,一价拍卖在某些情况下能提供比二价拍卖更好的社会福利界限。

独立同分布情况

假设有 N 个竞拍者,其估值独立同分布于 0 到 1 之间。在一价拍卖中,没有占优策略,你需要根据他人的行为来调整出价。在独立同分布情况下,存在唯一的贝叶斯纳什均衡。

以下是均衡出价策略:

  • 如果所有竞拍者估值独立同分布,均衡策略是按 (n-1)/n 的比例削减估值出价。
  • 当 N=2 时,最优策略是出价自己估值的一半,前提是假设对方也出价其估值的一半。

更一般地,在独立同分布设置中,唯一的对称贝叶斯纳什均衡是:每个竞拍者出价等于 给定自己是最高估值者时,第二高估值的期望值

由于在均衡中,每个人都使用相同且严格递增的出价函数,因此最高出价者总是估值最高的人。这意味着效率为 100%,无政府状态价格为 1。

独立但不同分布情况

现在,我们放松独立同分布的假设,考虑独立但不同的分布。在这种情况下,一价拍卖不再保证完全效率。

以下是一个关键点:

  • 在非独立同分布情况下,贝叶斯纳什均衡的无政府状态价格可能严格小于 1。
  • 这意味着存在正概率,使得估值较低的人因为出价策略的差异而赢得拍卖。

直观理解是,竞拍者面临的竞争环境不同,导致其削减估值的程度不同,从而可能引发效率损失。


分析工具:平滑性不等式与扩展定理

为了分析一价拍卖的无政府状态价格,我们将使用与二价拍卖类似的分析范式:首先证明一个平滑性不等式,然后利用扩展定理将其推广到贝叶斯纳什均衡。我们的目标是避免在分析中直接处理先验分布。

单物品一价拍卖的平滑性不等式

我们首先为单物品一价拍卖证明一个类似之前使用过的平滑性不等式。

我们需要构造一组偏离出价 B_i*,它们是估值剖面 V 的函数,但不依赖于其他人的出价 B,使得以下不等式成立:

对于所有估值剖面 V 和所有出价剖面 B,有:
Σ_i [U_i(B_i*, B_{-i})] ≥ (1/2) * V_max - B_max

其中:

  • U_i 是竞拍者 i 的效用。
  • V_max 是最高估值。
  • B_max 是最高出价。

构造偏离出价
在二价拍卖中,最优偏离是让赢家“全力出价”(即出价等于其估值)。在一价拍卖中,“全力出价”会导致零效用,因此不是好策略。
解决方案是进行对冲:我们让每个竞拍者 i 的偏离出价 B_i* 等于其估值 V_i 的一半,即 B_i* = V_i / 2

证明简述
如果 (1/2)*V_max ≤ B_max,则不等式右边非正,左边效用和非负,不等式自然成立。
如果 (1/2)*V_max > B_max,那么估值最高的竞拍者在其偏离出价 V_max/2 时将会获胜。其效用至少为 V_max - (V_max/2) = V_max/2,这恰好大于或等于不等式右边 (1/2)*V_max - B_max(因为此时 B_max < V_max/2)。
因此,不等式成立。

这个简单的证明给出了因子 2(即 1/2)的界限。后续可以通过更巧妙的偏离策略(例如随机化偏离)来改进这个界限。


从单物品到多物品:同时组合

上一节我们为单物品一价拍卖建立了平滑性不等式。本节中,我们来看看如何将其扩展到多物品同时一价拍卖。

估值类别:XOS 估值

我们关注 XOS 估值函数类,它包含了子模函数。XOS 估值的关键性质是:对于任何最优分配方案中的物品束,存在一个加性估值函数,它在该物品束上与原估值相等,并在其他所有物品束上低估原估值。

偏离出价的构造

给定估值剖面 V 及其最优分配 S_1*, ..., S_n*,我们为每个竞拍者 i 构造偏离出价 B_i* 如下:

  1. 根据 XOS 性质,为每个 i 选择加性估值函数 a_i*,使其在 S_i* 上等于 V_i(S_i*),且处处低估 V_i
  2. 对于每个物品 j,设置偏离出价:
    • 如果物品 j 在 S_i* 中,则 B_ij* = (1/2) * a_ij*(即“半力出价”)。
    • 否则,B_ij* = 0

同时组合定理

利用 XOS 估值可分解为加性函数的性质,以及一价拍卖中支付是可加的事实,我们可以将多物品同时拍卖的平滑性分析,分解为每个单物品拍卖的平滑性分析之和。

具体步骤如下:

  1. 将竞拍者的真实 XOS 估值 V_i 替换为对应的加性估值 a_i*。由于 a_i* 低估 V_i,这只会低估总效用,不影响不等式方向。
  2. 在加性估值下,竞拍者在各物品上的效用和支付完全解耦。
  3. 对每个物品 j 单独应用单物品一价拍卖的平滑性不等式。因为我们在每个物品 j 上为竞拍者 i 设置的偏离出价 B_ij* 恰好是 (1/2)*a_ij*,满足了单物品不等式的要求。
  4. 将各物品的不等式相加,并利用 a_i* 的构造性质(Σ_j∈S_i* a_ij* = V_i(S_i*)),我们最终得到适用于多物品同时一价拍卖的平滑性不等式:
    Σ_i [U_i(B_i*, B_{-i})] ≥ (1/2) * OPT(V) - Σ_j B_max(j)
    其中 OPT(V) 是最优社会福利,B_max(j) 是物品 j 上的最高出价。

这个结果表明,只要每个单物品机制满足平滑性不等式,那么它们的同时组合也满足类似的平滑性不等式。这大大简化了分析复杂度。


均衡下的社会福利界限

利用上面证明的平滑性不等式,结合不同的扩展定理,我们可以得到各类均衡概念下的社会福利保证。

纯纳什均衡与完全信息概念

对于纯纳什均衡,我们可以证明社会福利至少是最优社会福利的 1/2。
证明的关键技巧是利用一价拍卖的特性:在均衡中,支付的总和等于最高出价的总和。在平滑性不等式的推导中,这个支付项恰好可以与不等式右边的 Σ_j B_max(j) 项相抵消,从而直接得到 社会福利 ≥ (1/2) * OPT
这个论证可以扩展到其他完全信息均衡概念,如混合纳什均衡、相关均衡等。

贝叶斯纳什均衡(单物品与相关先验)

对于单物品一价拍卖,我们有一个更强的结果:即使竞拍者的估值来自相关先验分布,贝叶斯纳什均衡的无政府状态价格也至少为 1/2。
这是因为我们构造的偏离出价 B_i* = V_i / 2 只依赖于竞拍者 i 自己的估值 V_i,而不依赖于其他人的估值 V_{-i}。这使得扩展定理即使在相关分布下也能适用。
这个结果很有价值,因为对于相关先验分布,通常很难得到无政府状态价格界限。

贝叶斯纳什均衡(多物品与独立先验)

对于多物品同时一价拍卖,在独立先验分布下,贝叶斯纳什均衡的无政府状态价格也至少为 1/2。
证明需要用到“分身”技巧:竞拍者 i 不知道他人的真实估值,但可以根据已知的先验分布,为他人采样一组“分身”估值。然后,基于这组分身估值计算出一个“假设的”最优分配,并按照之前的方法构造偏离出价。最后,利用独立分布的性质和平滑性不等式完成证明。
与二价拍卖不同,这里不需要“禁止超额出价”的假设,因为在一价拍卖中,出价超过自己的估值会导致负效用,在均衡中不会发生。


总结与比较

本节课中,我们一起学习了一价拍卖的无政府状态价格分析。

核心要点总结

  1. 分析框架:我们采用了“平滑性不等式 + 扩展定理”的框架。首先为基本机制(单物品一价拍卖)证明一个分布无关的平滑性不等式,然后通过扩展定理将其推广到贝叶斯纳什均衡等复杂均衡概念。
  2. 同时组合定理:对于 XOS 估值,同时运行多个单物品一价拍卖的整体平滑性,可以归结为各单物品拍卖平滑性的和。这极大地简化了对复杂机制的分析。
  3. 一价 vs 二价
    • 在独立先验、多物品、XOS 估值设置下,同时一价拍卖同时二价拍卖都能保证至少 50% 的社会福利(无政府状态价格 ≤ 2)。
    • 一价拍卖的优势在于:其分析不需要超额出价假设;对于单物品情况,其界限甚至适用于相关先验分布
    • 通过更精细的分析(如使用随机化偏离策略),一价拍卖的界限可以提升到约 63%,这严格优于二价拍卖已知的紧界限(50%)。因此,从最坏情况社会福利损失的角度看,一价规则可能优于二价规则。

工具回顾

  • 扩展定理:让你只需为简单均衡(如纯纳什)证明平滑性界限,即可自动获得复杂均衡(如贝叶斯纳什)下的相同界限。
  • 同时组合定理:让你只需为组成复杂机制的单个简单机制证明平滑性,即可自动获得整个复杂机制的平滑性。

这两个工具的结合,为分析现实世界中许多简单拍卖格式在复杂环境下的性能提供了强大而通用的方法论。

017:机制设计前沿(第17a讲 - 多单位拍卖中的需求缩减)

在本节课中,我们将学习如何将之前建立的“平滑性”分析框架应用于一种新的拍卖形式——统一价格拍卖,并分析其均衡效率。我们将证明,即使在存在“需求缩减”这一非激励相容行为的情况下,该拍卖的贝叶斯纳什均衡仍能保证一个恒定的社会福利损失上界。


概述

在前几讲中,我们专注于分析简单的拍卖格式,并探讨在何种条件下其均衡能保证良好的效率(即无政府价格接近1)。我们主要研究了同时进行的单物品拍卖(包括第二价格和第一价格版本),并建立了扩展定理和组合定理来分析无政府价格。

本节课的目标是展示我们的分析工具箱足够强大,可以覆盖其他有趣的拍卖格式。我们将首先回顾一个“老朋友”——统一价格拍卖,并应用相同的工具箱来证明一些新的效率边界。然后,我们将探讨如何超越平滑性框架,分析更一般的设定。


需求缩减的无政府价格

首先,让我们回顾一下在课程第一部分(约第3、4讲)讨论过的设定、拍卖格式和激励问题。当时我们称之为“情景四”。

设定回顾

  • 物品:存在 M 个完全相同的物品。
  • 竞拍者:有 n 个竞拍者,他们不一定是单位需求的,可能想要多个物品。
  • 估值:假设估值是向下倾斜的。这意味着每增加一个物品的边际价值是非递增的(即随着获得物品数量的增加,边际价值下降)。
  • 表示方法:这样的估值由获得第 j 件物品的边际价值 μ_ij 来指定。向下倾斜意味着 μ_i1 ≥ μ_i2 ≥ μ_i3 ≥ ...

这是总替代场景在物品完全相同情况下的一个特例。

社会福利最大化分配

假设我们知道真实的边际估值 μ,如何分配 M 件物品以最大化社会福利?答案是一个简单的贪心算法:

  1. 将所有竞拍者的所有边际价值 μ_ij 排序。
  2. 将物品分配给最高的 M 个 μ_ij 所对应的竞拍者。

由于估值向下倾斜,每个竞拍者获得的物品将对应其边际价值序列的一个前缀(即前几个最高的值)。因此,这个分配规则是合理的。

统一价格拍卖机制

我们如何将这个分配规则转化为一个机制?直接显示机制是 VCG 机制,它会为不同物品收取不同的价格(即使物品相同)。然而,在本课程中,我们更关注简单的拍卖格式。

一个更简单的想法是统一价格拍卖

  • 分配规则:给定竞拍者的出价 b_ij,将物品分配给最高的 M 个出价。
  • 支付规则:所有获胜者为他们赢得的每一件物品支付相同的价格,该价格等于第 (M+1) 高的出价(即最高的失败出价)。

这类似于单物品第二价格拍卖的扩展,试图实现最小的瓦尔拉斯均衡价格。

需求缩减问题

然而,统一价格拍卖不是占优策略激励相容的。原因在于需求缩减

示例
假设 M=2,有两个竞拍者:

  • 竞拍者1是可加的:每件物品价值为 3。所以其真实边际估值为 μ_11=3, μ_12=3
  • 竞拍者2是单位需求的:只想要一件物品,价值为 2。所以 μ_21=2, μ_22=0

分析

  • 如果双方真实出价 (b_11=3, b_12=3, b_21=2, b_22=0),则最高的两个出价是 3 和 3,竞拍者1赢得两件物品。价格是第3高的出价,即 2。竞拍者1的效用为:价值(6) - 支付(2*2=4) = 2。
  • 如果竞拍者1进行“需求缩减”,假装自己是单位需求,只报告 b_11=3, b_12=0。那么最高的两个出价是 3 和 2,竞拍者1和2各得一件物品。此时最高的失败出价是 0,因此价格为 0。竞拍者1的效用为:价值(3) - 支付(0) = 3。
  • 结论:竞拍者1通过谎报(减少需求)获得了更高的效用(3 > 2)。因此,真实出价不是占优策略。

这表明,由于需求缩减,统一价格拍卖不是激励相容的。


均衡效率分析

既然统一价格拍卖不是激励相容的,我们很自然地要问:在均衡状态下,它的效率损失有多大?这正是我们在课程第四部分所关注的问题。

主要结果

在一定的“禁止过高出价”假设下,我们可以证明,对于统一价格拍卖,其贝叶斯纳什均衡的无政府价格是一个常数,下界为 1/4。这个结果甚至适用于相关先验分布,这非常强大,因为我们之前很少看到针对相关先验的结果。

“禁止过高出价”假设
对于任何竞拍者 i 和其赢得的物品集合,其对这些物品的总出价不超过其对这些物品的真实总边际价值。用公式表示,如果竞拍者 i 在出价向量 B 下赢得 x_i(B) 件物品,那么:

Σ_{j=1}^{x_i(B)} b_ij ≤ Σ_{j=1}^{x_i(B)} μ_ij

这个条件防止了竞拍者进行不理性的过高出价。

证明思路:应用平滑性框架

根据我们之前建立的框架,证明这样的无政府价格边界,可以归结为证明一个合适的平滑性条件

我们需要证明存在一个假设的偏离策略 B_i^*(允许依赖于估值 μ),使得对于所有可能的出价向量 B(无论是否是均衡),以下不等式成立:

Σ_i [ u_i(B_i^*, B_{-i}) ] ≥ (1/2) * OPT(μ) - Σ_i [ Σ_{j=1}^{x_i(B)} b_ij ]

其中:

  • u_i(B_i^*, B_{-i}) 是竞拍者 i 单方面偏离到 B_i^* 而其他人保持 B 不变时的效用。
  • OPT(μ) 是在真实估值 μ 下的最优社会福利。
  • Σ_{j=1}^{x_i(B)} b_ij 是竞拍者 i 在原始出价 B 下,对其所赢物品的总出价。

如果我们能证明这个平滑性条件(公式 (★)),并结合“禁止过高出价”假设(将误差项 Σ_i [ Σ_{j=1}^{x_i(B)} b_ij ] 的上界与均衡福利联系起来),就能推导出 1/4 的无政府价格边界。

偏离策略的选择

证明的关键在于构造合适的假设偏离策略 B_i^*。我们尝试了两种思路:

思路一(依赖于全局信息)
计算竞拍者 i 在最优分配 OPT(μ) 中应该获得的物品数量 x_i^*。然后,对于前 x_i^* 件物品,出价为其真实边际价值 μ_ij,对于之后的物品出价为 0。即:

B_i^*: 对于 j ≤ x_i^*, b_ij^* = μ_ij;对于 j > x_i^*, b_ij^* = 0

但这个策略过于激进,可能导致竞拍者支付过高的价格,从而效用为零,无法满足平滑性不等式。

思路二(折半策略 - 依赖于局部信息)
受到第一价格拍卖分析的启发,我们采用一个更保守且只依赖于自身估值的策略:始终出价为其边际价值的一半。即:

B_i^*: 对于所有 j, b_ij^* = μ_ij / 2

这个策略是可行的,因为统一价格拍卖允许竞拍者报告任何向下倾斜的估值,因此报告 μ_i/2 是允许的。正是由于这个偏离策略只依赖于 μ_i,我们才能将结果扩展到相关先验分布


平滑性条件证明概要

我们将证明,采用偏离策略 B_i^* = μ_i / 2 时,平滑性条件 (★) 成立。

固定一个任意的出价向量 B。我们需要分析当某个竞拍者 i 偏离到 B_i^* 时的效用。

观察:由于竞拍者 i 的出价是其价值的一半 (μ_ij/2),而支付不会超过这个出价,因此他赢得的每一件物品都至少能带来 μ_ij/2 的效用(因为价值 μ_ij 减去至多 μ_ij/2 的支付)。

情况一:偏离后获得的物品数不少于最优分配数
假设竞拍者 i 偏离后获得的物品数 x_i ≥ x_i^*(其在最优分配中应得的数量)。那么,仅从前 x_i^* 件物品中,他获得的效用就至少为 Σ_{j=1}^{x_i^*} (μ_ij/2),这正好是其在最优社会福利中所贡献价值的一半。这对于证明 (★) 来说已经足够了(甚至更强)。

情况二:偏离后获得的物品数少于最优分配数
这是更有趣的情况。设 x_i < x_i^*

  1. 对于实际赢得的 x_i 件物品,效用至少为 Σ_{j=1}^{x_i} (μ_ij/2)
  2. 对于在最优分配中应得但未获得的物品(第 x_i+1x_i^* 件),我们注意到,竞拍者 i 对这些物品的出价 μ_ij/2 未能进入最高的 M 个出价之列。因此,存在其他竞拍者更高的出价(即最终分配中某些获胜的出价)超过了这些 μ_ij/2

我们可以将竞拍者 i 的效用下写为:

u_i(B_i^*, B_{-i}) ≥ Σ_{j=1}^{x_i^*} (μ_ij/2) - Σ_{j=x_i+1}^{x_i^*} (某个 ≥ μ_ij/2 的获胜出价)

不等式右边第一部分是 OPT(μ) 中属于 i 的部分的一半。第二部分是一个“误差项”。

求和与误差项界定
当我们对所有竞拍者 i 求和时:

  • 第一部分的总和就是 (1/2) * OPT(μ)
  • 第二部分的总和,由于每个 μ_ij/2 都被一个不低于它的获胜出价所“覆盖”,并且所有竞拍者的 x_i^* 之和为 M(物品总数),因此这些被覆盖的项总共最多对应 M 个获胜出价。而且,在求和时,我们总是用较小的 μ_ij/2 去匹配较大的获胜出价,因此这 M 个获胜出价的和至少是误差项的和。

实际上,误差项的和被所有获胜出价的总和 Σ_i [ Σ_{j=1}^{x_i(B)} b_ij ] 所界定。这正是平滑性条件 (★) 中需要减去的项。

由此,我们完成了平滑性条件 (★) 的证明。


扩展与总结

通过上述证明,我们得到了以下结论:

  1. 均衡效率:在“禁止过高出价”假设下,统一价格拍卖的贝叶斯纳什均衡能保证至少 1/4 的社会福利(相对于最优福利)。
  2. 相关先验:由于我们使用的偏离策略 B_i^* = μ_i / 2 只依赖于竞拍者自身的估值,该结果可以扩展到相关先验分布
  3. 扩展性:类似的证明思路可以扩展到“按出价支付”的版本,可能将效率因子提升至 1/2。更重要的是,该分析可以进一步推广到非相同物品总替代估值的场景,这相当于对像 Kelso-Crawford 这样的经典但非激励相容的升价拍卖进行了均衡效率分析,为这些已有数十年历史的拍卖格式提供了全新的理论支撑。

本节课中,我们一起学习了如何将平滑性分析框架应用于统一价格拍卖,证明了尽管存在需求缩减问题,其均衡效率仍有常数保证。这展示了我们工具箱的强大通用性,并为分析更广泛的非激励相容机制奠定了基础。

018:超越平滑性与XOS估值

在本节课中,我们将探讨在比XOS估值更一般的估值类别下,如何为简单拍卖格式(如同步一价拍卖)证明福利保证。我们将学习一种超越“平滑性”框架的直接论证方法,并了解其在次可加估值下的应用。

上一节我们介绍了XOS估值及其在平滑性分析中的应用。本节中,我们来看看当估值类别扩展到次可加时,我们如何绕过平滑性框架,直接证明贝叶斯纳什均衡的福利保证。

次可加估值:最一般的场景

这是迄今为止我们见过的最一般的场景。竞拍者具有所谓的次可加估值

定义:对于任意两个物品束S和T,估值函数v是次可加的,如果满足:
v(S ∪ T) ≤ v(S) + v(T)

以下是关于次可加估值的一些关键点:

  • 它严格比XOS估值更一般。任何XOS估值都是次可加的,但反之则不然。
  • 它严格比子模估值更一般。
  • 在仅考虑算法(不考虑激励)的情况下,次可加估值是已知能在多项式时间内获得常数因子近似福利最大化的最一般类别之一(例如,存在2-近似算法)。
  • 对于次可加估值,没有已知的能实现常数因子近似的确定性机制。

因此,次可加估值在某种程度上代表了我们对简单拍卖仍能抱有常数因子福利保证希望的理论边界。

简单拍卖的表现与平滑性的局限

那么,如果使用简单的同步一价或二价拍卖,结果会如何?

事实:平滑性分析似乎无法为次可加估值带来常数因子的价格。根据目前对平滑性局限的理解,它最多能给出类似于 1/log(m) 的价格(m为物品数量)。

从XOS过渡到次可加时出现对数因子的原因是:在XOS的平滑性证明中,我们构造的偏离出价 b_i* 需要两个关键性质:1)在目标物品束上精确反映估值;2)在其他任何子集上都不高估。对于次可加估值,要针对一个目标集合出价,可能被迫在某些子集上以对数因子高估,这个对数因子会在分析中造成问题。

因此,我们需要一种直接论证的方法来获得更好的界限。

直接论证的核心思想

我们将要使用的证明方法,其核心思想是允许我们构造的假设性偏离出价 b_i* 依赖于我们所考察的特定贝叶斯纳什均衡 σ

这与平滑性论证的关键区别在于量化顺序:

  • 平滑性:对于每个估值剖面 v,存在偏离出价 b*,使得对于所有出价剖面 b,平滑不等式成立。(b* 独立于 b
  • 直接论证:对于每个特定的均衡 σ(它诱导了其他竞拍者出价的分布 D),我们为每个竞拍者 i 构造一个依赖于 D 的偏离出价 b_i*,来证明这个特定均衡是好的。

也就是说,我们采用均衡特定的偏离,而非均衡无关的偏离。这足以证明所有均衡都是近似最优的,虽然不是平滑性证明,但论证过程在精神上相似。

关键引理:对称性论证

以下引理是整个分析的核心,它巧妙地利用了次可加性和对称性。

引理:考虑一个具有次可加估值 v_i 的竞拍者 i。固定其他竞拍者出价的一个分布 D(可视为来自某个均衡),并固定一个目标物品束 S。那么,存在一个偏离出价 b_i*(它是 DS 的函数),使得竞拍者 i 的期望效用满足:
E[utility_i(b_i*, D)] ≥ (1/2) * v_i(S) - E[ Σ_{j in S} (max_{k ≠ i} b_{kj}) ]
其中,期望是关于分布 D 取的。

证明概要
我们使用概率法。我们随机地选择 b_i*,并证明在期望下不等式成立,从而存在某个确定性的选择满足不等式。

  1. 随机偏离的构造

    • 从分布 D 中采样一个其他竞拍者的出价剖面 a_{-i}
    • 对于目标束 S 中的每个物品 j,设置我们的出价 b_{ij}*a_{-i} 中在物品 j 上的最高出价。对于 S 之外的物品,出价为0。
    • 即,我们模仿其他竞拍者中出价最高者的行为。
  2. 分析期望支付

    • 竞拍者 i 的期望支付最多为其期望出价总和:E[ Σ_{j in S} b_{ij}* ]
    • 根据构造,b_{ij}* 的分布与 max_{k ≠ i} b_{kj}(来自 D)的分布相同。因此,期望支付 ≤ E[ Σ_{j in S} (max_{k ≠ i} b_{kj}) ]
  3. 分析期望福利(所得价值)

    • A 表示我们赢得的 S 的子集。我们需要分析 E[ v_i(A) ]
    • 关键对称性观察:对于任意子集 A ⊆ S,我们恰好赢得 A 的概率,等于我们恰好赢得其补集 S \ A 的概率。这是因为我们的出价分布 (a_{-i}) 与其他人的出价分布 (b_{-i}) 相同,交换两者角色就会交换事件“赢得A”和“赢得S\A”。
    • 利用这个对称性,并将子集与其补集配对,我们可以写出:
      E[ v_i(A) ] = (1/2) * E[ v_i(A) + v_i(S \ A) ] (对配对求和并利用等概率)
    • 应用次可加性:v_i(A) + v_i(S \ A) ≥ v_i(S)
    • 因此,E[ v_i(A) ] ≥ (1/2) * v_i(S)
  4. 结合效用

    • 效用 = 所得价值 - 支付。
    • 所以,E[utility] ≥ (1/2)*v_i(S) - E[ Σ_{j in S} (max_{k ≠ i} b_{kj}) ]

这个引理将替代平滑性条件,在后续的价格证明中发挥作用。

主要定理:同步一价拍卖的价格

现在,我们使用上述关键引理来证明主要结果。

定理:对于具有次可加估值的竞拍者,在任意乘积先验分布下,同步一价拍卖的贝叶斯纳什均衡的期望社会福利至少是最优期望社会福利的 1/2

证明思路

  1. 从福利到效用:和往常一样,我们关注均衡下的总效用,因为均衡条件是关于效用的。总福利 = 总效用 + 拍卖商收入。
    E[Welfare(σ)] = E[ Σ_i u_i(σ) ] + E[Revenue(σ)]

  2. 利用均衡条件与构造偏离

    • 考虑一个竞拍者 i,其真实类型为 v_i,处于均衡 σ 中。
    • 为了给 i 找到一个好的偏离,我们使用“替身技巧”:
      • i 幻想其他竞拍者的类型为 w_{-i}(从公共先验中采样)。
      • 基于真实类型 v_i 和幻想类型 w_{-i},计算一个福利最优分配。令 S_i* 为在此最优分配中 i 获得的物品束。
      • 现在,i 知道了目标束 S_i*,也知道了其他竞拍者在均衡 σ 下的出价分布 D = σ_{-i}(v_{-i})(这里 v_{-i} 来自先验)。
      • 应用关键引理i 可以构造一个偏离出价 b_i*(依赖于 DS_i*),使得其期望效用满足引理中的下界。
    • 因为 σ 是贝叶斯纳什均衡,i 采用此偏离策略的期望效用不会高于其均衡效用。因此,我们对 i 的均衡效用有了一个下界。
  3. 对下界进行求和与期望

    • 对每个竞拍者 i 写出其均衡效用的这个下界。
    • 对所有竞拍者求和,并对所有类型剖面取期望。
    • 经过代数处理(类似于我们之前分析替身技巧时),会出现两项:
      1. (1/2) * E[OPT]:这正是我们想要的,即最优福利的一半。
      2. - E[ Σ_i Σ_{j in S_i*} (max_{k ≠ i} b_{kj}(σ(v)) ) ]:这是一个“错误项”。
  4. 处理错误项

    • 通过巧妙地重新排列求和顺序,并利用幻想类型 w 与真实类型 v 同分布的事实,可以证明这个错误项恰好等于(负的)均衡下的期望总收入 -E[Revenue(σ)]
    • 详细步骤涉及将求和 Σ_i Σ_{j in S_i*} 交换为 Σ_j,并注意到对于固定的类型剖面,最优分配中的物品束 {S_i*} 构成了物品全集的一个划分。
  5. 完成证明

    • 将下界代入总福利公式:
      E[Welfare(σ)] = E[ Σ_i u_i(σ) ] + E[Revenue(σ)]
      ≥ (1/2)*E[OPT] - E[Revenue(σ)] + E[Revenue(σ)]
      = (1/2)*E[OPT]

因此,我们证明了均衡福利至少是最优福利的一半。对于同步二价拍卖,可以使用类似但更复杂的论证,得到 1/4 的常数因子。

总结

本节课中我们一起学习了:

  1. 次可加估值是比XOS更一般的估值类别,也是已知常数因子算法福利近似的边界。
  2. 传统的平滑性框架在次可加估值下会遇到障碍,最多只能给出带对数因子的价格。
  3. 我们介绍了一种直接论证方法,其核心是允许偏离策略依赖于所分析的特定贝叶斯纳什均衡。
  4. 通过一个巧妙的关键引理,我们利用对称性和次可加性,为竞拍者构造了一个能保证其获得至少一半目标束价值(减去一个错误项)的随机偏离策略。
  5. 结合替身技巧和均衡条件,我们最终证明了对于次可加估值,同步一价拍卖的贝叶斯纳什均衡能实现至少 1/2 的福利近似比。

这个结果非常强大,因为它在一个极其一般的估值类别下,为非常简单的拍卖格式提供了常数因子的福利保证,其性能与不考虑激励问题的最先进算法具有可比性。证明中的新颖思想在于认识到可以利用均衡分布的知识来构造偏离,并通过模仿其他竞拍者出价的对称性论证来获得强下界。

019:多参数收益最大化

在本节课中,我们将从社会福利最大化转向收益最大化,探讨多参数环境下的最优机制设计。我们将回顾单参数环境下的经典理论,并揭示多参数世界带来的全新挑战。

课程回顾:单参数收益最大化

在前面的课程中,我们主要关注社会福利最大化。然而,收益最大化带来了不同的挑战。在单参数环境下,Myerson的最优拍卖理论提供了一个清晰的解决方案。

单买家单物品情况

对于一个买家和一个物品,最优机制非常简单:设定一个“要么接受,要么放弃”的价格。给定买家估值的先验分布 $ F $,最优价格 $ r $ 是最大化 $ r \times (1 - F(r)) $ 的值。

多买家单物品情况:Myerson定理

对于多个买家和单个物品,假设每个买家 $ i $ 的估值 $ v_i $ 独立地来自已知的先验分布 $ F_i $。Myerson定理指出,最大化期望收益等价于最大化期望虚拟福利

买家的虚拟估值函数定义为:
$$
\phi_i(v_i) = v_i - \frac{1 - F_i(v_i)}{f_i(v_i)}
$$
其中 $ f_i $ 是概率密度函数。

最优拍卖规则如下:

  1. 要求每个买家报告其估值。
  2. 计算每个买家的虚拟估值 $ \phi_i(v_i) $。
  3. 将物品授予虚拟估值最高的买家,但前提是该虚拟估值非负。
  4. 如果所有虚拟估值均为负,则不进行销售。

在估值分布相同且“规则”(即虚拟估值函数单调递增)的特殊情况下,这简化为带有合适保留价的第二价格拍卖。

核心洞见: 在单参数设置中,最大化期望收益可以规约为最大化期望虚拟福利。这意味着,如果你有一个能高效最大化社会福利的算法,你可以将其用作黑盒来最大化收益,只需将输入估值替换为虚拟估值即可。


转向多参数世界

上一节我们回顾了单参数环境下优雅的收益最大化理论。本节中,我们来看看当买家对多个异质物品有估值时,情况变得多么复杂。我们将通过简单的例子说明,即使对于单个买家,最优机制也可能与直觉大相径庭。

热身:单个买家,两个物品

考虑一个买家对两个物品具有可加性估值,即获得物品组合的价值是单个物品价值之和。假设每个物品的估值 $ v_1, v_2 $ 独立同分布。

示例 1:估值分布为 {1, 2},概率各 50%

  • 分开销售: 对每个物品设定垄断价格(1或2)。期望收益为 $ 1 + 1 = 2 $。
  • 捆绑销售(仅以套餐形式出售两个物品): 设定套餐价格为3。买家仅在 $ v_1 + v_2 \geq 3 $ 时购买。计算可得期望收益为 $ 2.25 $。
  • 结论: 捆绑销售优于分开销售。

示例 2:估值分布为 {0, 1, 2},概率各 1/3

  • 分开销售: 期望收益为 $ 4/3 $。
  • 捆绑销售(价格为2或3): 期望收益也为 $ 4/3 $。
  • 更优的机制: 提供以下选项:
    • 以价格2购买任一物品。
    • 以价格3购买两个物品(套餐)。
    • 计算可得期望收益大于 $ 4/3 $。
  • 结论: 提供包含部分套餐的菜单比单纯的捆绑或分开销售更优。

示例 3:估值分布为 {1, 2, 4},概率分别为 1/6, 1/2, 1/3

  • 最优机制(随机化): 提供以下选项:
    • 以价格1购买一个“彩票”,有50%概率获得物品A(另一个物品同理)。
    • 以价格4确定性地购买两个物品。
  • 关键发现: 此例中的唯一最优机制是随机化的。所有确定性机制(即结果仅为:一无所获、获得物品1、获得物品2、获得两个物品)的收益都严格更差。

多参数世界的启示

从以上简单的例子中,我们可以得出重要结论:

  1. 机制形式依赖先验: 即使只有单个买家、两个物品、可加性估值且独立同分布,最优机制的形式(分开销售、纯捆绑、菜单、是否随机化)也会随着先验分布 $ F $ 的微小变化而发生显著改变。这与单参数情况(仅价格变化)形成鲜明对比。
  2. 随机化可能是必要的: 在单参数规则分布下,最优机制总是确定性的。但在多参数下,即使是最简单的设置,随机化机制也可能严格优于任何确定性机制。
  3. 不存在简单的“虚拟估值”类比: 这表明,不存在一个像Myerson定理那样简单的通用公式,能够通过确定性的变换将估值映射为“虚拟估值”,然后运行社会福利最大化来得到最优拍卖。多参数问题在本质上更加复杂。

线性规划方法

面对多参数收益最大化的复杂性,我们需要更强大的分析工具。本节介绍如何使用线性规划来刻画和求解最优机制。

单个买家情况

假设有 $ m $ 个物品,单个买家的估值向量 $ \mathbf{v} = (v_1, ..., v_m) $ 来自一个有限支撑集 $ V $,且服从已知的先验分布(概率 $ f(\mathbf{v}) $)。买家具有可加性估值且风险中性。

决策变量:

  • $ x_j(\mathbf{v}) $:当买家报告估值 $ \mathbf{v} $ 时,其获得物品 $ j $ 的概率
  • $ p(\mathbf{v}) $:当买家报告估值 $ \mathbf{v} $ 时,其期望支付。

线性规划公式:

  • 目标(最大化期望收益):
    $$
    \max \sum_{\mathbf{v} \in V} f(\mathbf{v}) \cdot p(\mathbf{v})
    $$

  • 激励相容约束(IC): 对于所有真实估值 $ \mathbf{v} $ 和可能误报的 $ \mathbf{v}' $,
    $$
    \sum_{j=1}^m v_j \cdot x_j(\mathbf{v}) - p(\mathbf{v}) \geq \sum_{j=1}^m v_j \cdot x_j(\mathbf{v}') - p(\mathbf{v}')
    $$

  • 个体理性约束(IR): 对于所有估值 $ \mathbf{v} $,
    $$
    \sum_{j=1}^m v_j \cdot x_j(\mathbf{v}) - p(\mathbf{v}) \geq 0
    $$

  • 概率约束: 对于所有 $ j, \mathbf{v} $,
    $$
    0 \leq x_j(\mathbf{v}) \leq 1
    $$

该线性规划的解与满足IC和IR的直接显示机制一一对应。求解此线性规划即得到针对给定先验的收益最大化机制。

扩展到多个买家

对于 $ n $ 个买家,每个买家 $ i $ 的估值向量来自有限支撑集。假设估值分布独立。

决策变量扩展:

  • $ x_{ij}(\mathbf{v}) $:当估值剖面为 $ \mathbf{v} = (v_1, ..., v_n) $ 时,买家 $ i $ 获得物品 $ j $ 的概率。
  • $ p_i(\mathbf{v}) $:在估值剖面 $ \mathbf{v} $ 下,买家 $ i $ 的期望支付。

线性规划公式(贝叶斯激励相容):

  • 目标:
    $$
    \max \sum_{\mathbf{v}} \left( \prod_{i} f_i(v_i) \right) \cdot \left( \sum_{i=1}^n p_i(\mathbf{v}) \right)
    $$

  • 贝叶斯激励相容约束(BIC): 对于每个买家 $ i $,其所有可能真实类型 $ v_i $ 和误报类型 $ v_i' $,
    $$
    \mathbb{E}{\mathbf{v}{-i}} \left[ \sum_{j} v_{ij} \cdot x_{ij}(v_i, \mathbf{v}{-i}) - p_i(v_i, \mathbf{v}) \right] \geq \mathbb{E}{\mathbf{v}{-i}} \left[ \sum_{j} v_{ij} \cdot x_{ij}(v_i', \mathbf{v}{-i}) - p_i(v_i', \mathbf{v}) \right]
    $$

  • 贝叶斯个体理性约束(IR): 对于每个买家 $ i $ 及其类型 $ v_i $,
    $$
    \mathbb{E}{\mathbf{v}{-i}} \left[ \sum_{j} v_{ij} \cdot x_{ij}(v_i, \mathbf{v}{-i}) - p_i(v_i, \mathbf{v}) \right] \geq 0
    $$

  • 可行性约束: 对于每个物品 $ j $ 和估值剖面 $ \mathbf{v} $,
    $$
    \sum_{i=1}^n x_{ij}(\mathbf{v}) \leq 1
    $$

  • 非负性约束。

同样,此线性规划的解对应于贝叶斯激励相容且个体理性的直接显示机制。

方法面临的挑战

线性规划方法在概念上很优美,但它有一个主要的可扩展性问题:变量和约束的数量随着买家数量 $ n $ 和每个买家可能的估值类型数量呈指数级增长。即使每个买家只有两种可能的估值类型,估值剖面的数量也高达 $ 2^n $。这使得对于任何合理数量的买家,直接求解这个线性规划在计算上都是不可行的。


总结

本节课中,我们一起学习了从单参数到多参数收益最大化问题的过渡。我们首先回顾了Myerson的单参数最优拍卖理论,其核心是将收益最大化规约为虚拟福利最大化。然后,我们通过简单的例子发现,在多参数环境下(即使只有一个买家和两个物品),最优机制的形式可能非常复杂,并且可能必须包含随机化,这打破了单参数理论中的确定性性质。为了系统性地研究多参数最优机制,我们引入了线性规划建模方法。该方法虽然概念清晰,并能精确描述最优机制,但面临着变量空间随买家数量指数膨胀的计算挑战。在接下来的课程中,我们将探讨如何克服这一挑战,并介绍近年来在该领域取得的一些突破性进展。

020:中期规则与Border定理

在本节课中,我们将学习在多参数环境下如何构建一个更简洁的线性规划来描述最优拍卖问题。我们将重点关注中期分配规则,并利用Border定理来刻画其可行性,从而为理解最优机制的结构奠定基础。

课程回顾与目标设定

上一讲我们介绍了多参数环境下的收益最大化问题。在单参数情况下,Myerson理论为我们提供了清晰的最优拍卖方案:最大化虚拟福利。然而,在多参数环境中,情况变得复杂,最优机制可能非常奇特,甚至需要随机化。

我们的目标是尽可能接近Myerson理论的“圣杯”,即在多参数世界中找到一个类似的、概念清晰且计算可行的框架。具体来说,我们希望:

  1. 概念/结构上:理解最优机制的形式。
  2. 计算上:将收益最大化问题简化为福利最大化问题。

上一讲我们提出了一个描述最优拍卖的线性规划,但其变量和约束数量随参与者数量呈指数级增长,因此不具计算实用性。本节的核心任务是进行维度缩减,构建一个变量数量仅随参与者数量线性增长的等效线性规划。

线性规划与维度缩减思路

首先,回顾上一讲末尾给出的线性规划形式。其决策变量是事后分配规则 $ x_{ij}(\mathbf{v}) $ 和事后支付规则 $ p_i(\mathbf{v}) $,它们依赖于完整的估值剖面 $\mathbf{v}$。目标函数是期望收益,约束包括贝叶斯激励相容、个体理性和分配可行性。

该线性规划的主要问题是规模过大。因此,我们引入中期规则作为新的变量集,以期大幅减少变量数量。

中期分配与支付规则

中期规则是从事后规则推导出来的,它只依赖于单个参与者的报告类型,并对其他参与者的未知类型取期望。

  • 中期分配规则 $ y_{ij}(v_i) $:表示当参与者 $i$ 报告类型 $v_i$ 时,获得物品 $j$ 的期望概率。计算公式为:
    $$
    y_{ij}(v_i) = \mathbb{E}{\mathbf{v} \sim F_{-i}} [x_{ij}(v_i, \mathbf{v}_{-i})]
    $$
  • 中期支付规则 $ q_i(v_i) $:表示当参与者 $i$ 报告类型 $v_i$ 时,其期望支付。计算公式为:
    $$
    q_i(v_i) = \mathbb{E}{\mathbf{v} \sim F_{-i}} [p_i(v_i, \mathbf{v}_{-i})]
    $$

我们将由机制 $(X, P)$ 导出的中期规则 $(Y, Q)$ 称为该机制的简化形式。关键点在于,期望收益、BIC约束和IR约束都可以完全用中期规则 $(Y, Q)$ 来表达,而无需涉及完整的事后规则。

  • 期望收益:$\sum_i \sum_{v_i \in V_i} f_i(v_i) \cdot q_i(v_i)$
  • BIC约束:对于所有参与者 $i$,其真实类型 $v_i$ 和虚假报告 $v_i'$,有
    $$
    \sum_j v_{ij} \cdot y_{ij}(v_i) - q_i(v_i) \geq \sum_j v_{ij} \cdot y_{ij}(v_i') - q_i(v_i')
    $$
  • IR约束:对于所有参与者 $i$ 及其类型 $v_i$,有
    $$
    \sum_j v_{ij} \cdot y_{ij}(v_i) - q_i(v_i) \geq 0
    $$

然而,分配可行性约束(即每个物品最多分配给一个人)无法直接用中期规则简单表达。我们需要找到一组用 $Y$ 描述的约束条件,来确保存在一个可行的事后分配规则 $X$ 能够实现给定的中期规则 $Y$。

可行性约束与Border定理

我们首先看一个明显的必要条件。对于任何物品 $j$,由于它最多只能分配给一个人,所有参与者获得该物品的期望概率之和必须不超过1:
$$
\sum_i \sum_{v_i \in V_i} f_i(v_i) \cdot y_{ij}(v_i) \leq 1
$$
但这并不充分。通过一个简单的双参与者、单物品的例子可以说明,存在满足上述条件的中期规则 $Y$,却没有任何可行的事后分配规则 $X$ 能实现它。

因此,我们需要更强、更完整的约束集来刻画中期规则的可行性。这就是Border定理的核心内容。

Border定理的表述

Border定理为加性估值情况下的中期分配规则可行性提供了完整刻画。

定理(Border):一个中期分配规则 $ y_{ij}(v_i) $ 可以由某个可行的事后分配规则 $ x_{ij}(\mathbf{v}) $ 导出,当且仅当对于每一个物品 $j$,以及对于每一个参与者 $i$ 的任意类型子集 $S_i \subseteq V_i$,以下不等式成立:
$$
\sum_{i=1}^n \sum_{v_i \in S_i} f_i(v_i) \cdot y_{ij}(v_i) \leq 1 - \prod_{i=1}^n \left(1 - \sum_{v_i \in S_i} f_i(v_i)\right)
$$
不等式左侧:表示“获胜者的类型属于对应集合 $S_i$”的期望概率。
不等式右侧:表示“至少存在一个参与者,其类型属于其对应集合 $S_i$”的概率。

这个定理指出,所有这样的不等式共同构成了中期规则可行的充分必要条件。如果一组中期规则 $Y$ 满足所有这些不等式(对于所有物品和所有可能的类型子集选择),那么就一定存在一个可行的事后分配规则 $X$ 能实现它。

Border定理的证明思路(最大流-最小割)

定理的证明巧妙地运用了最大流-最小割定理。思路如下:

  1. 构建流网络:我们为每个物品 $j$ 单独构建一个流网络。

    • 源点 $S$ 连接到所有可能的估值剖面节点,容量为该剖面出现的先验概率 $f(\mathbf{v})$。
    • 每个估值剖面节点连接到一组“参与者-类型”获胜节点(例如“参与者1以类型$v_1$获胜”)和一个“无人获胜”节点。连接到“参与者-类型”节点的边容量为无穷大(或足够大)。
    • 每个“参与者-类型”获胜节点连接到汇点 $T$,容量为给定的中期规则值 $f_i(v_i) \cdot y_{ij}(v_i)$。“无人获胜”节点连接到汇点的容量为剩余概率。
  2. 建立等价关系:可以证明,在这个网络中存在一个值为1的最大流,当且仅当存在一个可行的事后分配规则 $X$ 实现给定的中期规则 $Y$。流的大小对应分配的概率。

  3. 应用最大流-最小割定理:根据最大流-最小割定理,最大流值为1等价于网络中每一个$S-T$割的容量至少为1。

  4. 将割与Border条件关联:任意给定一个$S-T$割,我们可以定义一组类型子集 $S_i$,其中包含那些所有出现该类型的估值剖面节点都在割的源点侧的类型。通过分析这个割的容量,可以证明其容量至少为1的条件,恰好等价于Border定理中的不等式条件。

因此,Border定理的不等式组确保了网络中所有割的容量至少为1,从而保证了值为1的流(即可行的事后分配规则)的存在。

构建简洁的线性规划

利用Border定理,我们现在可以构建想要的简洁线性规划:

  • 变量:中期分配规则 $ y_{ij}(v_i) $ 和中期支付规则 $ q_i(v_i) $。
  • 目标函数:最大化期望收益 $\sum_i \sum_{v_i} f_i(v_i) \cdot q_i(v_i)$。
  • 约束
    1. BIC约束(用 $Y, Q$ 表达)。
    2. IR约束(用 $Y, Q$ 表达)。
    3. Border可行性约束:对于每个物品 $j$ 和所有可能的类型子集组合 ${S_i \subseteq V_i}$,加入Border不等式。
    4. 自然约束:$ 0 \leq y_{ij}(v_i) \leq 1 $。

这个新的线性规划:

  • 变量数量是多项式级别的(与参与者数量 $n$ 线性相关)。
  • 约束数量虽然很多(Border约束有指数多个),但变量集是简洁的。更重要的是,这个规划完全刻画了机制设计的可行域——它的每个可行解 $(Y, Q)$ 都对应一个(或多个)贝叶斯激励相容、个体理性且可行的直接显示机制。

本节总结

本节课中,我们一起学习了如何利用中期规则Border定理来简化多参数收益最大化问题的表述。

  1. 我们首先明确了目标:寻找一个变量更少的线性规划来描述最优拍卖。
  2. 我们引入了中期分配规则中期支付规则作为新的变量集,它们能简洁地表达收益、激励相容和个体理性。
  3. 我们认识到,关键挑战在于用中期规则来表达分配可行性。简单的加总约束并不充分。
  4. 我们学习了Border定理,它为加性估值下的中期规则可行性提供了完整且精确的刻画:一组中期规则可行,当且仅当它满足所有Border不等式。
  5. 最后,我们利用Border定理构建了一个新的线性规划,该规划使用简洁的中期变量,并包含了确保可行性的完整约束集。

这为我们下一步分析最优机制的结构——探索其与虚拟福利最大化之间的联系——奠定了坚实的基础。在下节课中,我们将以此为基础,进一步推广结论,并最终揭示多参数环境下最优机制的结构性特征。

021:收益最大化拍卖的特征描述

在本节课中,我们将学习如何描述和计算收益最大化的拍卖机制。我们将从回顾上一讲的内容开始,然后深入探讨一个核心的结构性定理,该定理揭示了最优拍卖机制的本质。最后,我们将讨论相关的计算问题。

课程回顾

上一讲我们介绍了如何将复杂的拍卖机制设计问题简化为一个线性规划问题。我们通过只关注期中分配规则支付规则,将问题表述为一个决策变量数量相对较少的线性规划。

几何视角

为了更好地理解,我们可以从几何角度看待这个问题。原始的分配规则 X 存在于一个高维的多面体中。我们通过一个线性投影操作,将其映射到一个低维空间,得到期中规则 Y。这个投影过程可以表示为:

Y = 投影操作(X)

我们上一讲所做的工作,就是找到了这个投影后低维多面体 Y 的显式描述(即所有约束条件)。这个多面体中的点,就是所有可行的期中分配规则。

核心结构定理

本节中,我们将探讨一个关键的结构性定理,它揭示了最优拍卖机制的形式。

定理(主要结构定理):对于投影多面体 Y 中的每一个顶点,都存在一个虚拟福利最大化的分配规则 X,其投影恰好是这个顶点。

这意味着,任何可行的期中分配规则(即多面体 Y 中的点),都可以表示为这些顶点(即虚拟福利最大化机制的期中形式)的凸组合。

什么是虚拟福利最大化器?

一个虚拟福利最大化器是一种分配规则 X,其工作原理如下:

  1. 它预先定义一组函数 φ_i,j(v_i),这些函数将竞拍者 i 对物品 j 的报告估值 v_i 映射为一个“虚拟权重”。
  2. 当收到所有竞拍者的估值报告后,机制计算每个竞拍者-物品对的虚拟权重。
  3. 机制在所有可行的分配方案中,选择能使虚拟权重总和最大化的那个方案。

在单位需求竞拍者的特例下,这等价于一个基于虚拟权重的最大权匹配问题。

定理的推论与应用

基于上述主要定理,我们可以得出两个重要推论,这为我们提供了迈尔森理论在多参数环境下的类比。

推论一:对于任何一个可行的分配规则 X,都存在一个由虚拟福利最大化器构成的分布(即一个随机机制),使得该分布与原始规则 X 具有完全相同的期中分配形式。

证明思路:将 X 投影到低维空间得到点 y。由于 y 位于多面体 Y 内部,它可以表示为 Y 的若干顶点的凸组合。根据主要定理,每个顶点都对应一个虚拟福利最大化器。取这些虚拟福利最大化器,并按照相同的凸组合系数构成一个随机机制,该机制的期中形式就是 y,与 X 相同。

推论二(收益最大化):存在一个收益最大化的拍卖机制,它是一个由虚拟福利最大化器构成的分布。

证明思路:任取一个收益最大化的拍卖机制,根据推论一,我们可以找到一个由虚拟福利最大化器构成的分布,使其具有相同的期中形式。由于收益只取决于期中形式,这个新机制也具有相同的最大收益,因此它也是一个最优拍卖机制。

这个结论非常有力:尽管在多参数环境下最优机制可能很复杂(需要随机化,且虚拟值没有显式公式),但其结构本质上仍然是随机化地选择虚拟福利最大化器。

主要结构定理的证明概要

现在,我们来看看如何证明这个核心的结构定理。考虑低维多面体 Y 中的一个顶点 y*

  1. 顶点特征:在多面体中,顶点可以被刻画为某个线性目标函数的唯一最大化点。因此,存在一个权重向量 W,使得 y* 是最大化 W·y 的唯一解。
  2. 定义虚拟函数:利用这个权重向量 W,我们定义虚拟估值函数:
    φ_i,j(v_i) = W_i,j(v_i) / Pr[v_i]
    这里除以先验概率 Pr[v_i] 是为了在期望计算中与期中规则 Y 正确对应。
  3. 构建最大化器:考虑使用上面定义的 φ 函数的虚拟福利最大化器分配规则 X*。根据定义,X* 在每一个估值剖面 v 上都最大化虚拟福利 Σ φ_i,j(v_i) * x_i,j(v)
  4. 建立等价关系:可以证明,任何分配规则 X 的期望虚拟福利,等于其期中形式 y 与权重向量 W 的点积,即 E[虚拟福利] = W·y
  5. 完成证明:由于 X* 最大化期望虚拟福利,根据上一步的等价关系,它的期中形式 y 也最大化 W·y。而 y*W·y 的唯一最大化点,因此必有 y = y*。这就证明了顶点 y* 确实是由虚拟福利最大化器 X* 诱导出来的。

计算上的考虑

虽然我们在概念上理解了最优拍卖的结构,但实际计算仍面临挑战。以下是几个关键的计算问题:

  1. 可行性验证:给定一个声称的期中分配规则 y,如何在多项式时间内判断它是否真的可行(即属于多面体 Y)?
  2. 优化问题:如何直接在期中规则的空间 Y 中,优化目标(如收益)以找到最优的 y
  3. 机制重构:找到最优的 y 后,如何实际构造出一个能实现它的、由虚拟福利最大化器构成的分布?

解决这些问题的关键工具是椭球法。其核心在于实现一个分离预言机:给定一个点 y,判断它是否在 Y 内;如果不在,则返回一个将其分离出来的超平面。

一个关键的子问题是:对于给定的权重向量 W,计算最大的虚拟福利值。这本质上是一个福利最大化问题。因此,一个必要的计算条件是:基础环境的福利最大化问题必须在多项式时间内可解。

令人鼓舞的是,这个条件也几乎是充分的。如果有一个黑盒算法可以解决带权重的福利最大化问题,那么结合椭球法,原则上可以在多项式时间内解决上述所有计算问题,从而找到并实现收益最大化的拍卖机制。

课程总结

本节课中,我们一起学习了多参数机制设计中收益最大化拍卖的特征描述。

  1. 我们首先回顾了如何将机制设计问题简化为关于期中规则的线性规划。
  2. 然后,我们介绍并证明了一个核心的结构定理:所有可行期中规则构成的凸多面体,其顶点都对应着虚拟福利最大化机制。
  3. 由此我们得出关键推论:任何拍卖机制在收益上等价于某个由虚拟福利最大化器构成的随机机制;最优拍卖机制也具有此形式。
  4. 最后,我们探讨了相关的计算问题,指出福利最大化问题的可解性是实现最优机制计算的关键,并概述了利用椭球法解决这些问题的途径。

这个理论为我们提供了理解多参数最优拍卖的强有力框架,尽管存在随机化和计算复杂性的新挑战,但它成功地将单参数下的迈尔森理论精髓推广到了更一般的环境。

posted @ 2026-03-26 13:17  布客飞龙V  阅读(0)  评论(0)    收藏  举报