东印度公司 (EIC) 经济章程

\[\newcommand{\cur}[1]{\left\{#1\right\}} \newcommand{\d}{\mathrm d} \]

Lec 1.

金融系统中,人类是 有策略 (strategic) 的(例如,他们可能会谎报地址,以进入更近的学校)——这一点与计算机系统中有所不同。因此,Market Design 的核心问题即为,设计参与者是有策略时仍然能 work 的原则。


有一个概率 \(p\),和一个满足 \(p\)-Bernoulli 的可观测的分布。你如何通过经济利益向一个知道 \(p\) 且贪婪的人问出 \(p\)

  • 首先,你可以让他给一个预测,预测成功给他 \(1\)。这只能够判断出是否大于 \(0.5\)
  • 如果不很好地设置 reward 函数,给出的预测仍然是毫无信息量的。
  • ML 和经济学的对齐(?)

Lec 2.

Serial Dictatorship:

随机顺序 \(\pi\) 排列所有 agent,然后要求它们的喜好 \((\theta_1,\dots,\theta_n)\);之后按顺序给每个人分配它们评价最高的资源。这样确实可以避免 agent 说谎,但似乎无法达到最优总距离?

——但是,可以证明,这个已经足够好了:一切确定性的好机制都与该机制(为了将其改造为确定性的,\(\pi\) 不再能是随机的,而要是固定且公开的)等价。

在市场设计中,我们总是假设存在一个 central planner,且设计的目标是最大化社会总福祉。

假设有一个 central planner 要处理 \(n\) 个 agent。每个 agent 都有一个私有的类型 \(\theta_i\in\Theta_i\)(在填报学校时,\(\theta_i\) 就是地址)。central planner 需要选择一个 outcome \(A\) 即一组匹配。所有 agent 进行一个行为 \(m_i\in M_i\),则一个机制 \(\phi(m_1,\dots,m_n)\in A\) 描述行动生成 \(A\) 的过程。同时存在一个公开的效用函数 \(u_i(\theta_i,a)\)(在填报学校时,这是距离)。

一个好的机制应该保证,在所有 agent 都是自私时,仍然能最大化社会总福祉。


一个 action 集合 \(\cur{m_1,\dots,m_n}\) 是一个 weakly dominant strategy equilibrium,如果所有 agent \(i\) 无论其它 agent 的选择,总会选择 \(m_i\)。即,对于其它人的任何选择 \(m_{-i}'\),均有

\[u_i(\theta_i,\phi(m_i,m'_{-i}))\geq u_i(\theta_i,\phi(m_i',m'_{-i})) \]

——但是,就算已经达到了 weakly dominant,总社会福祉一定最优吗?并不是,因为我们有囚徒困境。

Nash Equilibrium:在其它人的决策固定且公开时,所有人的决策均最适应于当前态。

\[u_i(\theta_i,\phi(m_i,m_{-i}))\geq u_i(\theta_i,\phi(m_i',m_{-i})) \]

Theorem (Nash):如果允许 mixed strategy(即在决策中引入随机性),则所有博弈都存在 Nash 均衡。


Utilitarian Welfare Maximazation:\(f(\theta)=\arg\max_{a\in A}\sum_i u_i(\theta_i,a)\)

Weighted Utilitarian Welfare Maximization:\(f(\theta)=\arg\max_{a\in A}\sum_i w_i\cdot u_i(\theta_i,a)\)

Log Welfare Maximization:\(\arg\max\prod_i u_i(\theta_i,a)=\arg\max\sum_i\log u_i(\theta_i,a)\)——更加公平。

哪种最好?不知道!所以只能使用 Pareto Optimality:不存在其它的结果,使得所有人都不变差的同时,有至少一个人严格变好。

一个 mechanism 实现了 Pareto Optimal,如果它存在一个 Weakly Dominant 且其是 Pareto。


One-Sided Matching:

  • \(n\) 个 agent 和 \(n\) 个资源。
  • outcomes \(\Pi\) 是 agent-资源间的匹配。
  • 所有 agent 都有私有类型 \(\theta_i\in\Theta_i\),有 \(\theta_{i,j}\) 是被分配 \(j\) 时的效用。故 \(u_i(\theta_i,\pi)=\theta_{i,\pi(i)}\)

如果 agent 不存在相等偏好,则 Serial Dictatorship 显然是 Pareto 的。

定理:所有有 WD 是 PO 的都等价于 Serial Dictatorship。

来证明!

定义:Direct Mechanism——直接让所有 agent 给出它们的 type 的 Mechanism。

Lec 3.

定理:在单向匹配问题里,如果「性质足够好的」确定性 IC 机制使用占优策略实现 Pareto 最优,则其等价于序列独裁策略。

如何放松?

  • 允许使用非确定性机制。
  • 放松 IC 限制。
  • 要求效用函数满足某种结构。例如,假如引入「金钱」的概念后,效用函数就要求服从某种特殊的模式。

首先是非确定性的场合。我们有 Random Serial Dictatorship:

  • 机制是,「均匀随机一个 \(\pi\) 然后按照其顺序分配」。随机 \(\pi\) 发生在所有 agent 公布它们的偏好 \(\theta\) 后。
  • 显然,该机制仍然是 IC 的,且不仅如此,其对于所有人是公平的。
  • 它是否是 Pareto 的呢?这取决于我们如何定义!

定义:

  • ex-post Pareto Optimality:跑了一遍 mechanism,得到一个结果,并检查该结果是否处于 PO 态。显然,RSD 是事后 Pareto 的。
  • ex-ante Pareto Optimality:将「随机性」也考虑入。

一个机制会对应一个结果空间上的分布 \(p(\pi)\)。如果不存在其它任何分布 \(p'(\pi)\) 使得所有人的期望效用都不变差的同时,有人的期望效用变好了。

\[\nexists p'(\pi)\text{ s.t. } \\\forall i:\sum_{\pi}p'(\pi)u_i(\theta_i,\pi)\geq\sum_{\pi}p(\pi)u_i(\theta_i,\pi) \\\exists j:\sum_{\pi}p'(\pi)u_j(\theta_j,\pi)>\sum_{\pi}p(\pi)u_j(\theta_j,\pi) \]

有人给出了妙妙反例,证明了 RSD 不是事前 Pareto 的。

有人给出了妙妙定理,证明了不存在 anonymous, strategy-proof 且是事前 Pareto 的机制。

这表明:随机可以减轻公平问题,但代价是损害了 Pareto。


定义:一个 随机匹配矩阵 (random assignment matrix) 是一个 双随机 (bistochastic) 矩阵,即每行每列和均为一的矩阵。

定义:一个 排列矩阵 (permutation matrix) 是一个所有项均为 \(0\)\(1\) 的随机匹配矩阵。匹配与排列矩阵等价。

定义:Birkhoff-von Neumann 定理:一切双随机矩阵都能被表示为排列矩阵的凸组合(即所有系数非负的组合)。

因此,一切随机分配策略都可以被解释为一车确定性匹配上的摇奖。

每个人只在意它们最终得到的 RAM,因此在分析随机 IC 策略时可能性时,可以直接考虑 RAM——由 Birkhoff-von Neumann 定理,只要有 RAM 就能搓对应的机制出来。

Cake Eating 算法

  • 一个算法是速度函数向量 \(\omega=\cur{\omega_i(\cdot)}\),每个函数均有 \(\int\omega_i(t)\d t=1\)
  • 每个 agent 是一只老鼠,每个资源是一个大小为 1 的蛋糕。
  • 只要还有至少一个蛋糕剩余,所有老鼠就会以 \(\omega_i(t)\) 的速率吃它最喜欢的蛋糕。
  • 这样得到的东西就是一个 RAM,其中的每行每列是老鼠吃掉蛋糕的比例。

Single-Item Auction:

有一个 seller 和 \(n\) 个 buyer,只有一个 item。

central planner 要选择一个 outcome \((x,p)=(\cur{x_i},\cur{p_i})\),其中 allocation \(x_i\) 是 agent \(i\) 获得之的概率,expected payment \(p_i\) 是期望从 \(i\) 身上获得的收益(也即,其实际上获得该 item 时,要支付的价格为 \(p_i/x_i\))。

某个 agent 的期望收益是 \(\theta_ix_i-p_i\),其中 \(\theta_i\) 是其对该物品价值的衡量。

一个机制是设置 action 集合 \(\cur{M_i}\) 以及给出对应的机制 \(\phi(m)=(x,p)\) 的方法。

目标:

  • optimal。
  • DSE。
  • 每个人要感觉合理:即 \(u_i\geq0\)。如果它 \(<0\),则它不会愿意参与拍卖。(individual rationality

如何定义 optimality?可以定义 social welfare 为 \(\sum_i\theta_ix_i\)。注意,此处并没有减去 \(p_i\)——因为它纳入了 seller 的收益。也可以写成 \(\sum u_i+\sum p_i\) 的形式——后者是 seller 收益。那么,此时的最大值在 \(x=\arg\max\theta\) 处取得。

那么何时有 DSE 呢?不管所有人干嘛,直接固定一组 \(x_i\),是一个 DSE——虽然它毫无意义。

如何售卖物品?

  • 设置一个价格。但是如果多人都出到了价格线上呢?随机挑人吗?那这就不是 Pareto Optimal 了。
  • 所以要拍卖。有两种拍卖模式:

降价模式:从高价开始不断降价,直到某人接受价格。这不存在 DSE:因为一个人可以在不超过第二大的人之前一直不入场。

加价模式:从低价开始不断加价,直到只剩一人愿意接受价格。这是存在 DSE 的:所有人的策略都是,在价格没达到 \(\theta\) 前,一直 stay,直到超过价格后 quit。同时它是 IC 的。

但是它也有问题:它要求事实的 bidding 流程,不方便。

所以有一个让事情更简单的方式:first-price auction,所有人给一个 bid,出价最高者获得物品。

但问题很显然:它没有 DSE。

Lec 4.

假设第 \(i\) 个人在 first-price auction 中叫价 \(b_i\),则其事实上与降价模式中,「当售价降到 \(b_i\) 即接受」的行为等价。因此 first-price auction 与降价模式等价。

那么能不能找一个与加价模式等价的方案呢?second-price auction。所有人给一个 bid,出价最高者支付第二高的价格。

显然这是 IC 的:如果所有其它人的出价都比某人低,那么它不管出什么价效果都一样;如果有人比它高,那么反正它不会叫价到比那个人更高(那样对它的收益是负的),所以出什么价效果仍然都一样。

那么 second-price auction 是唯一 strategyproof 吗?有请 Myerson's Lemma,其刻画了所有 strategyproof 的策略:

定义 Monotone Allocation Rule:一个机制 \(x(\theta)\) 是 monotone non-decreasing 的,如果对于一切 \(\cur{\theta_{i'\neq i}}\) 以及 \(\theta_i\leq \theta_i'\),均有 \(x_i(\theta_i,\cur{\theta_{i'}})\leq x_i(\theta_i',\cur{\theta_{i'}})\),也即,一个人把评价提高不会降低其竞标成功的概率。

那么有 Myerson's Lemma:一个 direct mechanism(要求所有人如实汇报它们的 type 的机制)是 IC 的,当且仅当 \(x(\theta)\) 是 monotone non-decreasing 的,且有

\[p_i(\theta)-p_i(0)=\theta_ix_i(\theta)-\int_0^{\theta_i}x_i(z)\d z \]

也即,在 \(\theta_i\)-\(x_i\) 图上,\(p_i\) 是一个曲线上方的面积。

这里省略了其它人的 type \(\cur{\theta_{i'}}\) 作为各个函数的参数。

首先证明 DSE 满足该条件。

固定所有其它 \(\theta_{i'}\),关注第 \(i\) 个 bidder。

若其真实值是 \(y\),则对于一切 \(y<z\),我们都要有

\[y\cdot x_i(y)-p_i(y)\geq y\cdot x_i(z)-p_i(z) \]

(这里省略了 \(\cur{\theta_i}\) 的参数)。

与此同时,当真实值是 \(z\) 时,我们又要有

\[z\cdot x_i(z)-p_i(z)\geq z\cdot x_i(y)-p_i(y) \]

将两式相减(上式左减下式右),得到

\[(y-z)\cdot x_i(y)\geq(y-z)\cdot x_i(z) \]

因为 \(y<z\),所以约掉要换号,于是知其是单调的。

现在仍然考虑真实 type 是 \(y\) 并汇报 \(z\) 的场合。其收益为 \(u_i(z)=y\cdot x_i(z)-p_i(z)\)。其在 \(y\) 处取得最大值,则有 \(u_i'(y)=0\),即 \(y\cdot x_i'(y)=p_i'(y)\)

现在两侧同时积分,即得 \(p_i(\theta_i)-p_i(0)=\int_0^{\theta_i}y\cdot x_i'(y)\d y\)。分部积分即可得我们需要的式子。

现在反过来。仍然假设真实 type 是 \(y\) 并有收益函数 \(u_i(z)\),然后对着积分式子玩一玩就玩出来了(?)

由 Myerson 引理可知 second-price auction 是唯一的 IC、最大化个人以及社会福祉、individual rationality 的 mechanism。


现在的 second price auction 最大化了社会福祉 \(\sum\theta_ix_i\),但是如果想最大化收益也即 \(\sum p_i\) 呢?则此时不存在一个统一的方案,seller 必须知道 buyer 的 type 分布才能对症下药。

因此令每个人的 distribution 是 \(f_i(\theta_i)\),则我们希望最大化期望收益

\[E_{\theta\sim f(\theta)}\sum p_i(\theta) \]

Virtual Value 定理:在 strategyproof mechanism 的场合,期望 revenue 等效于

\[\sum_iE[x_i(\theta)\psi_i(\theta)] \]

其中 \(\psi_i(\theta_i)=\theta_i-\dfrac{1-F_i(\theta_i)}{f_i(\theta_i)}\),其中 \(f\) 是 PDF 而 \(F\) 是 CDF。

这是因为由 Myerson Lemma,有

\[E[p_i(\theta_i)]=\int\Bigg[\theta_i\cdot x_i(\theta_i)-\int_0^{\theta_i}x_i(y)\d y\Bigg]f_i(\theta_i)\d\theta_i \\=\int\theta_ix_i(\theta_i)f_i(\theta_i)\d\theta_i-\int\d\theta_i\int_0^{\theta_i}x_i(y)f(\theta_i)\d y \\=\int\theta_ix_i(\theta_i)f_i(\theta_i)\d\theta_i-\int\d y\cdot x_i(y)\int_y^{\max}f(\theta_i)\d\theta_i \\=\int\theta_ix_i(\theta_i)f_i(\theta_i)\d\theta_i-\int\d y\cdot x_i(y)[1-F(y)] \\=\int f_i(\theta_i)x_i(\theta_i)\cdot\Big[\theta_i-\dfrac{1-F_i(\theta_i)}{f_i(\theta_i)}\Big] \]

感觉纯唐吧。

\(f\) 是 regular 的,如果其 virtual value function \(\psi\) 是严格增的。

Lec 5.

现在考虑多物品的场合。则此时的 outcome 是 \((x,p)\),其中 \(x_i\) 是第 \(i\) 个 agent 获得的物品集合(确定性),\(p_i\) 是其为这整个集合支付的总价。每个人的 utility function 是对整个物品集合而非单个物品定义的(也即,其不具有加性)。

一个场合是多物品拍卖,但每个人只想要一个(零个或大于一个的集合的 utility 是零)。

[!NOTE]

这与 One-Sided Matching 有一定区别——此处我们希望最大化总 utility,但是 OSM 我们只要找到 DSE 即可。

一种想法是一个个卖东西,然后对于售卖的每个物品运行 second price strategy。这有两种场合:

  • 所有人一开始即报告其出价,拍卖过程中不再更改。
  • 所有人在每一轮开始时出价,后面的结果依靠前面的结果。

可以简单构造例子说明其都没有最大化 utility。

另一个场合是最短路博弈:一张有向图,图上的每条边有边权,是这条边的运营成本。边的所有者可以报一个出价,经过这条边的人要支付出价,这条边的所有者的获益即为出价-成本。现在有一个人要从起点到终点,所有边的所有人要如何报价才能最大化收益?这也是一个多物品的场合。


Groves Mechanism 是 direct mechanism,要求所有人如实汇报它们对获得物品集合的评价 \(v_i\)。则有

\[x=\arg\max_y\sum_iv_i(y_i) \\p_i=h_i(v_{i'\neq i})-\sum_{j\neq i}v_j(x_j) \]

其中 \(h_i(\cdot)\) 是任意函数——但必须要仔细选择,不然就没有 individual rationality。

即,最终每个人收到的 \(x_i\) 是最大化总 utility 的 \(x_i\)

[!TIP]

single item 的 second price auction 场合是一种 Groves Mechanism:对于最高出价者,有 \(\sum_{j\neq i}v_j(x_i)=0\),所以直接令 \(h_i=\max\) 即可——而其它出价者二者抵消,可得其支付的价格为零。first price auction 不是 Groves Mechanism。

Groves Mechanism 是一种 IC 策略,因为对于第 \(i\) 个人,其收益为 \(\sum_jv_j(x_j)-h_i(v_{i'\neq i})\),前者被最大化了,后者与其自身的策略无关。因此这将个人收益与 social welfare 挂钩了,于是自然知其是 IC 的。同时也自然得知 \(h\) 要是保证所有人的 IR。

所以就要修正为 Vickrey-Clarke-Groves 策略:有 \(h_i(v_{i'\neq i})=\max_y\sum_{j\neq i}v_j(y_j)\)。那么首先有 \(p_i=\max_y\sum_{j\neq i}v_j(y_j)-\sum_{j\neq i}v_j(x_j)\geq0\)(当然,这需要 \(v_i\geq0\),因此在最短路博弈的场合该分析并不适用)于是有 designer rationality(designer 不需要掏钱来维持机制);进一步可以证明 individual rationality,因为 \(u_i=\max_y\sum_iv_i(y_i)-\max_y\sum_{j\neq i}v_j(y_j)\geq0\)


Free Market!

去中心化市场。此时卖方为每个物品明码标价。

如何定义 Equilibrium?使用 Walrasian Equilibrium:所有的 buyer 都不想购买其它东西代替;所有的 seller 都不想降价(这意味着所有未被售卖的物品的售价已经跌到零,降无可降了)。

形式化地,一个 outcome \((x,p)\) 处于 Walrasian Equilibrium,如果:

  • 所有 \(x_i\) 两两不交。
  • \(v_i(x_i)-\sum_{j\in x_i}p_j\geq\max_{S\sube[m]}\left[v_i(S)-\sum_{j\in S}p_j\right]\)
  • 对于 \(\forall i:j\notin x_i\)\(j\),有 \(p_j=0\)

如何达到这种 Equilibrium?首先考虑 unit-demand buyer 的场合,即所有人都只想要一个 item。此时定义 preferred items \(S_i\) 为收益最高的一批 item(可以有多个并列;可以不存在——如果所有物品对这个人而言都是负收益),preferred graph 是匹配的二分图,则有以下 ascending price mechanism:

  • 初始全体 \(p_j=0\)
  • 找到一组 buyer \(S\),其不满足 Hall 定理(即 \(|N(S)|<|S|\))且 \(|S|\) 最小,然后将 \(N(S)\) 的所有售价全都增加 \(1\)
  • 重复直到找不到这样的 \(S\)

首先其会在有限步内结束——因为售价总不会超过最高出价。

然后其会得到一个 WE。

维护一个满足所有售价非零的物品都有匹配,且一个 buyer 总会得到其 preferred items 之一的匹配。

初始售价全为零且匹配为空。

那么找到该最小 \(S\) 后,\(N(S)\) 的所有子集 \(T\) 都有 \(|N(T)\cap S|\geq T\)

  • 注意:此处的 \(S\)\(N(S)\) 同侧,\(T\)\(N(S)\) 同侧。

因为否则我们可以找到 \(S\setminus N(T)\) 作为一个更小的集合。于是进一步可知 \(|N(T)|\geq T\)

所以使用 Hall 定理,即知可找到 \(N(S)\) 的完美匹配。于是对维护的匹配执行如下流程:

  • 移除 \(S\) 的全体边(即 \(S\)\(N(S)\) 间的边)
  • 使用完美匹配将 \(N(S)\) 配对到 \(S\)
  • 提高 \(N(S)\) 中售价。这只会扩大 \(N(S)\) 的大小。
  • 于是知新匹配仍然满足上述条件。
posted @ 2025-10-20 13:45  Troverld  阅读(27)  评论(0)    收藏  举报