东印度公司 (EIC) 经济章程

\[\newcommand{\cur}[1]{\left\{#1\right\}} \newcommand{\d}{\mathrm d} \]

Lec 1.

金融系统中，人类是 有策略 (strategic) 的（例如，他们可能会谎报地址，以进入更近的学校）——这一点与计算机系统中有所不同。因此，Market Design 的核心问题即为，设计参与者是有策略时仍然能 work 的原则。

有一个概率 \(p\)，和一个满足 \(p\)-Bernoulli 的可观测的分布。你如何通过经济利益向一个知道 \(p\) 且贪婪的人问出 \(p\)？

首先，你可以让他给一个预测，预测成功给他 \(1\)。这只能够判断出是否大于 \(0.5\)。
如果不很好地设置 reward 函数，给出的预测仍然是毫无信息量的。
ML 和经济学的对齐（？）

Lec 2.

Serial Dictatorship：

以随机顺序 \(\pi\) 排列所有 agent，然后要求它们的喜好 \((\theta_1,\dots,\theta_n)\)；之后按顺序给每个人分配它们评价最高的资源。这样确实可以避免 agent 说谎，但似乎无法达到最优总距离？

——但是，可以证明，这个已经足够好了：一切确定性的好机制都与该机制（为了将其改造为确定性的，\(\pi\) 不再能是随机的，而要是固定且公开的）等价。

在市场设计中，我们总是假设存在一个 central planner，且设计的目标是最大化社会总福祉。

假设有一个 central planner 要处理 \(n\) 个 agent。每个 agent 都有一个私有的类型 \(\theta_i\in\Theta_i\)（在填报学校时，\(\theta_i\) 就是地址）。central planner 需要选择一个 outcome \(A\) 即一组匹配。所有 agent 进行一个行为 \(m_i\in M_i\)，则一个机制 \(\phi(m_1,\dots,m_n)\in A\) 描述行动生成 \(A\) 的过程。同时存在一个公开的效用函数 \(u_i(\theta_i,a)\)（在填报学校时，这是距离）。

一个好的机制应该保证，在所有 agent 都是自私时，仍然能最大化社会总福祉。

一个 action 集合 \(\cur{m_1,\dots,m_n}\) 是一个 weakly dominant strategy equilibrium，如果所有 agent \(i\) 无论其它 agent 的选择，总会选择 \(m_i\)。即，对于其它人的任何选择 \(m_{-i}'\)，均有

\[u_i(\theta_i,\phi(m_i,m'_{-i}))\geq u_i(\theta_i,\phi(m_i',m'_{-i})) \]

——但是，就算已经达到了 weakly dominant，总社会福祉一定最优吗？并不是，因为我们有囚徒困境。

Nash Equilibrium：在其它人的决策固定且公开时，所有人的决策均最适应于当前态。

\[u_i(\theta_i,\phi(m_i,m_{-i}))\geq u_i(\theta_i,\phi(m_i',m_{-i})) \]

Theorem (Nash)：如果允许 mixed strategy（即在决策中引入随机性），则所有博弈都存在 Nash 均衡。

Utilitarian Welfare Maximazation：\(f(\theta)=\arg\max_{a\in A}\sum_i u_i(\theta_i,a)\)。

Weighted Utilitarian Welfare Maximization：\(f(\theta)=\arg\max_{a\in A}\sum_i w_i\cdot u_i(\theta_i,a)\)

Log Welfare Maximization：\(\arg\max\prod_i u_i(\theta_i,a)=\arg\max\sum_i\log u_i(\theta_i,a)\)——更加公平。

哪种最好？不知道！所以只能使用 Pareto Optimality：不存在其它的结果，使得所有人都不变差的同时，有至少一个人严格变好。

一个 mechanism 实现了 Pareto Optimal，如果它存在一个 Weakly Dominant 且其是 Pareto。

One-Sided Matching：

有 \(n\) 个 agent 和 \(n\) 个资源。
outcomes \(\Pi\) 是 agent-资源间的匹配。
所有 agent 都有私有类型 \(\theta_i\in\Theta_i\)，有 \(\theta_{i,j}\) 是被分配 \(j\) 时的效用。故 \(u_i(\theta_i,\pi)=\theta_{i,\pi(i)}\)。

如果 agent 不存在相等偏好，则 Serial Dictatorship 显然是 Pareto 的。

定理：所有有 WD 是 PO 的都等价于 Serial Dictatorship。

来证明！

定义：Direct Mechanism——直接让所有 agent 给出它们的 type 的 Mechanism。

Lec 3.

定理：在单向匹配问题里，如果「性质足够好的」确定性 IC 机制使用占优策略实现 Pareto 最优，则其等价于序列独裁策略。

如何放松？

允许使用非确定性机制。
放松 IC 限制。
要求效用函数满足某种结构。例如，假如引入「金钱」的概念后，效用函数就要求服从某种特殊的模式。

首先是非确定性的场合。我们有 Random Serial Dictatorship：

机制是，「均匀随机一个 \(\pi\) 然后按照其顺序分配」。随机 \(\pi\) 发生在所有 agent 公布它们的偏好 \(\theta\) 后。
显然，该机制仍然是 IC 的，且不仅如此，其对于所有人是公平的。
它是否是 Pareto 的呢？这取决于我们如何定义！

定义：

ex-post Pareto Optimality：跑了一遍 mechanism，得到一个结果，并检查该结果是否处于 PO 态。显然，RSD 是事后 Pareto 的。
ex-ante Pareto Optimality：将「随机性」也考虑入。

一个机制会对应一个结果空间上的分布 \(p(\pi)\)。如果不存在其它任何分布 \(p'(\pi)\) 使得所有人的期望效用都不变差的同时，有人的期望效用变好了。

\[\nexists p'(\pi)\text{ s.t. } \\\forall i:\sum_{\pi}p'(\pi)u_i(\theta_i,\pi)\geq\sum_{\pi}p(\pi)u_i(\theta_i,\pi) \\\exists j:\sum_{\pi}p'(\pi)u_j(\theta_j,\pi)>\sum_{\pi}p(\pi)u_j(\theta_j,\pi) \]

有人给出了妙妙反例，证明了 RSD 不是事前 Pareto 的。

有人给出了妙妙定理，证明了不存在 anonymous, strategy-proof 且是事前 Pareto 的机制。

这表明：随机可以减轻公平问题，但代价是损害了 Pareto。

定义：一个 随机匹配矩阵 (random assignment matrix) 是一个 双随机 (bistochastic) 矩阵，即每行每列和均为一的矩阵。

定义：一个 排列矩阵 (permutation matrix) 是一个所有项均为 \(0\) 或 \(1\) 的随机匹配矩阵。匹配与排列矩阵等价。

定义：Birkhoff-von Neumann 定理：一切双随机矩阵都能被表示为排列矩阵的凸组合（即所有系数非负的组合）。

因此，一切随机分配策略都可以被解释为一车确定性匹配上的摇奖。

每个人只在意它们最终得到的 RAM，因此在分析随机 IC 策略时可能性时，可以直接考虑 RAM——由 Birkhoff-von Neumann 定理，只要有 RAM 就能搓对应的机制出来。

Cake Eating 算法：

一个算法是速度函数向量 \(\omega=\cur{\omega_i(\cdot)}\)，每个函数均有 \(\int\omega_i(t)\d t=1\)。
每个 agent 是一只老鼠，每个资源是一个大小为 1 的蛋糕。
只要还有至少一个蛋糕剩余，所有老鼠就会以 \(\omega_i(t)\) 的速率吃它最喜欢的蛋糕。
这样得到的东西就是一个 RAM，其中的每行每列是老鼠吃掉蛋糕的比例。

Single-Item Auction：

有一个 seller 和 \(n\) 个 buyer，只有一个 item。

central planner 要选择一个 outcome \((x,p)=(\cur{x_i},\cur{p_i})\)，其中 allocation \(x_i\) 是 agent \(i\) 获得之的概率，expected payment \(p_i\) 是期望从 \(i\) 身上获得的收益（也即，其实际上获得该 item 时，要支付的价格为 \(p_i/x_i\)）。

某个 agent 的期望收益是 \(\theta_ix_i-p_i\)，其中 \(\theta_i\) 是其对该物品价值的衡量。

一个机制是设置 action 集合 \(\cur{M_i}\) 以及给出对应的机制 \(\phi(m)=(x,p)\) 的方法。

目标：

optimal。
DSE。
每个人要感觉合理：即 \(u_i\geq0\)。如果它 \(<0\)，则它不会愿意参与拍卖。（individual rationality）

如何定义 optimality？可以定义 social welfare 为 \(\sum_i\theta_ix_i\)。注意，此处并没有减去 \(p_i\)——因为它纳入了 seller 的收益。也可以写成 \(\sum u_i+\sum p_i\) 的形式——后者是 seller 收益。那么，此时的最大值在 \(x=\arg\max\theta\) 处取得。

那么何时有 DSE 呢？不管所有人干嘛，直接固定一组 \(x_i\)，是一个 DSE——虽然它毫无意义。

如何售卖物品？

设置一个价格。但是如果多人都出到了价格线上呢？随机挑人吗？那这就不是 Pareto Optimal 了。
所以要拍卖。有两种拍卖模式：

降价模式：从高价开始不断降价，直到某人接受价格。这不存在 DSE：因为一个人可以在不超过第二大的人之前一直不入场。

加价模式：从低价开始不断加价，直到只剩一人愿意接受价格。这是存在 DSE 的：所有人的策略都是，在价格没达到 \(\theta\) 前，一直 stay，直到超过价格后 quit。同时它是 IC 的。

但是它也有问题：它要求事实的 bidding 流程，不方便。

所以有一个让事情更简单的方式：first-price auction，所有人给一个 bid，出价最高者获得物品。

但问题很显然：它没有 DSE。

Lec 4.

假设第 \(i\) 个人在 first-price auction 中叫价 \(b_i\)，则其事实上与降价模式中，「当售价降到 \(b_i\) 即接受」的行为等价。因此 first-price auction 与降价模式等价。

那么能不能找一个与加价模式等价的方案呢？second-price auction。所有人给一个 bid，出价最高者支付第二高的价格。

显然这是 IC 的：如果所有其它人的出价都比某人低，那么它不管出什么价效果都一样；如果有人比它高，那么反正它不会叫价到比那个人更高（那样对它的收益是负的），所以出什么价效果仍然都一样。

那么 second-price auction 是唯一 strategyproof 吗？有请 Myerson's Lemma，其刻画了所有 strategyproof 的策略：

定义 Monotone Allocation Rule：一个机制 \(x(\theta)\) 是 monotone non-decreasing 的，如果对于一切 \(\cur{\theta_{i'\neq i}}\) 以及 \(\theta_i\leq \theta_i'\)，均有 \(x_i(\theta_i,\cur{\theta_{i'}})\leq x_i(\theta_i',\cur{\theta_{i'}})\)，也即，一个人把评价提高不会降低其竞标成功的概率。

那么有 Myerson's Lemma：一个 direct mechanism（要求所有人如实汇报它们的 type 的机制）是 IC 的，当且仅当 \(x(\theta)\) 是 monotone non-decreasing 的，且有

\[p_i(\theta)-p_i(0)=\theta_ix_i(\theta)-\int_0^{\theta_i}x_i(z)\d z \]

也即，在 \(\theta_i\)-\(x_i\) 图上，\(p_i\) 是一个曲线上方的面积。

这里省略了其它人的 type \(\cur{\theta_{i'}}\) 作为各个函数的参数。

首先证明 DSE 满足该条件。

固定所有其它 \(\theta_{i'}\)，关注第 \(i\) 个 bidder。

若其真实值是 \(y\)，则对于一切 \(y<z\)，我们都要有

\[y\cdot x_i(y)-p_i(y)\geq y\cdot x_i(z)-p_i(z) \]
（这里省略了 \(\cur{\theta_i}\) 的参数）。

与此同时，当真实值是 \(z\) 时，我们又要有

\[z\cdot x_i(z)-p_i(z)\geq z\cdot x_i(y)-p_i(y) \]
将两式相减（上式左减下式右），得到

\[(y-z)\cdot x_i(y)\geq(y-z)\cdot x_i(z) \]
因为 \(y<z\)，所以约掉要换号，于是知其是单调的。

现在仍然考虑真实 type 是 \(y\) 并汇报 \(z\) 的场合。其收益为 \(u_i(z)=y\cdot x_i(z)-p_i(z)\)。其在 \(y\) 处取得最大值，则有 \(u_i'(y)=0\)，即 \(y\cdot x_i'(y)=p_i'(y)\)。

现在两侧同时积分，即得 \(p_i(\theta_i)-p_i(0)=\int_0^{\theta_i}y\cdot x_i'(y)\d y\)。分部积分即可得我们需要的式子。

现在反过来。仍然假设真实 type 是 \(y\) 并有收益函数 \(u_i(z)\)，然后对着积分式子玩一玩就玩出来了（？）

由 Myerson 引理可知 second-price auction 是唯一的 IC、最大化个人以及社会福祉、individual rationality 的 mechanism。

现在的 second price auction 最大化了社会福祉 \(\sum\theta_ix_i\)，但是如果想最大化收益也即 \(\sum p_i\) 呢？则此时不存在一个统一的方案，seller 必须知道 buyer 的 type 分布才能对症下药。

因此令每个人的 distribution 是 \(f_i(\theta_i)\)，则我们希望最大化期望收益

\[E_{\theta\sim f(\theta)}\sum p_i(\theta) \]

Virtual Value 定理：在 strategyproof mechanism 的场合，期望 revenue 等效于

\[\sum_iE[x_i(\theta)\psi_i(\theta)] \]

其中 \(\psi_i(\theta_i)=\theta_i-\dfrac{1-F_i(\theta_i)}{f_i(\theta_i)}\)，其中 \(f\) 是 PDF 而 \(F\) 是 CDF。

这是因为由 Myerson Lemma，有

\[E[p_i(\theta_i)]=\int\Bigg[\theta_i\cdot x_i(\theta_i)-\int_0^{\theta_i}x_i(y)\d y\Bigg]f_i(\theta_i)\d\theta_i \\=\int\theta_ix_i(\theta_i)f_i(\theta_i)\d\theta_i-\int\d\theta_i\int_0^{\theta_i}x_i(y)f(\theta_i)\d y \\=\int\theta_ix_i(\theta_i)f_i(\theta_i)\d\theta_i-\int\d y\cdot x_i(y)\int_y^{\max}f(\theta_i)\d\theta_i \\=\int\theta_ix_i(\theta_i)f_i(\theta_i)\d\theta_i-\int\d y\cdot x_i(y)[1-F(y)] \\=\int f_i(\theta_i)x_i(\theta_i)\cdot\Big[\theta_i-\dfrac{1-F_i(\theta_i)}{f_i(\theta_i)}\Big] \]

感觉纯唐吧。

称 \(f\) 是 regular 的，如果其 virtual value function \(\psi\) 是严格增的。

Lec 5.

现在考虑多物品的场合。则此时的 outcome 是 \((x,p)\)，其中 \(x_i\) 是第 \(i\) 个 agent 获得的物品集合（确定性），\(p_i\) 是其为这整个集合支付的总价。每个人的 utility function 是对整个物品集合而非单个物品定义的（也即，其不具有加性）。

一个场合是多物品拍卖，但每个人只想要一个（零个或大于一个的集合的 utility 是零）。

[!NOTE]

这与 One-Sided Matching 有一定区别——此处我们希望最大化总 utility，但是 OSM 我们只要找到 DSE 即可。

一种想法是一个个卖东西，然后对于售卖的每个物品运行 second price strategy。这有两种场合：

所有人一开始即报告其出价，拍卖过程中不再更改。
所有人在每一轮开始时出价，后面的结果依靠前面的结果。

可以简单构造例子说明其都没有最大化 utility。

另一个场合是最短路博弈：一张有向图，图上的每条边有边权，是这条边的运营成本。边的所有者可以报一个出价，经过这条边的人要支付出价，这条边的所有者的获益即为出价-成本。现在有一个人要从起点到终点，所有边的所有人要如何报价才能最大化收益？这也是一个多物品的场合。

Groves Mechanism 是 direct mechanism，要求所有人如实汇报它们对获得物品集合的评价 \(v_i\)。则有

\[x=\arg\max_y\sum_iv_i(y_i) \\p_i=h_i(v_{i'\neq i})-\sum_{j\neq i}v_j(x_j) \]

其中 \(h_i(\cdot)\) 是任意函数——但必须要仔细选择，不然就没有 individual rationality。

即，最终每个人收到的 \(x_i\) 是最大化总 utility 的 \(x_i\)。

[!TIP]

single item 的 second price auction 场合是一种 Groves Mechanism：对于最高出价者，有 \(\sum_{j\neq i}v_j(x_i)=0\)，所以直接令 \(h_i=\max\) 即可——而其它出价者二者抵消，可得其支付的价格为零。first price auction 不是 Groves Mechanism。

Groves Mechanism 是一种 IC 策略，因为对于第 \(i\) 个人，其收益为 \(\sum_jv_j(x_j)-h_i(v_{i'\neq i})\)，前者被最大化了，后者与其自身的策略无关。因此这将个人收益与 social welfare 挂钩了，于是自然知其是 IC 的。同时也自然得知 \(h\) 要是保证所有人的 IR。

所以就要修正为 Vickrey-Clarke-Groves 策略：有 \(h_i(v_{i'\neq i})=\max_y\sum_{j\neq i}v_j(y_j)\)。那么首先有 \(p_i=\max_y\sum_{j\neq i}v_j(y_j)-\sum_{j\neq i}v_j(x_j)\geq0\)（当然，这需要 \(v_i\geq0\)，因此在最短路博弈的场合该分析并不适用）于是有 designer rationality（designer 不需要掏钱来维持机制）；进一步可以证明 individual rationality，因为 \(u_i=\max_y\sum_iv_i(y_i)-\max_y\sum_{j\neq i}v_j(y_j)\geq0\)。

Free Market！

去中心化市场。此时卖方为每个物品明码标价。

如何定义 Equilibrium？使用 Walrasian Equilibrium：所有的 buyer 都不想购买其它东西代替；所有的 seller 都不想降价（这意味着所有未被售卖的物品的售价已经跌到零，降无可降了）。

形式化地，一个 outcome \((x,p)\) 处于 Walrasian Equilibrium，如果：

所有 \(x_i\) 两两不交。
有 \(v_i(x_i)-\sum_{j\in x_i}p_j\geq\max_{S\sube[m]}\left[v_i(S)-\sum_{j\in S}p_j\right]\)。
对于 \(\forall i:j\notin x_i\) 的 \(j\)，有 \(p_j=0\)。

如何达到这种 Equilibrium？首先考虑 unit-demand buyer 的场合，即所有人都只想要一个 item。此时定义 preferred items \(S_i\) 为收益最高的一批 item（可以有多个并列；可以不存在——如果所有物品对这个人而言都是负收益），preferred graph 是匹配的二分图，则有以下 ascending price mechanism：

初始全体 \(p_j=0\)。
找到一组 buyer \(S\)，其不满足 Hall 定理（即 \(|N(S)|<|S|\)）且 \(|S|\) 最小，然后将 \(N(S)\) 的所有售价全都增加 \(1\)。
重复直到找不到这样的 \(S\)。

首先其会在有限步内结束——因为售价总不会超过最高出价。

然后其会得到一个 WE。

维护一个满足所有售价非零的物品都有匹配，且一个 buyer 总会得到其 preferred items 之一的匹配。

初始售价全为零且匹配为空。

那么找到该最小 \(S\) 后，\(N(S)\) 的所有子集 \(T\) 都有 \(|N(T)\cap S|\geq T\)。

注意：此处的 \(S\) 与 \(N(S)\) 同侧，\(T\) 与 \(N(S)\) 同侧。

因为否则我们可以找到 \(S\setminus N(T)\) 作为一个更小的集合。于是进一步可知 \(|N(T)|\geq T\)。

所以使用 Hall 定理，即知可找到 \(N(S)\) 的完美匹配。于是对维护的匹配执行如下流程：

移除 \(S\) 的全体边（即 \(S\) 与 \(N(S)\) 间的边）

使用完美匹配将 \(N(S)\) 配对到 \(S\)。

提高 \(N(S)\) 中售价。这只会扩大 \(N(S)\) 的大小。

于是知新匹配仍然满足上述条件。

posted @ 2025-10-20 13:45 Troverld 阅读(55) 评论(0) 收藏举报

刷新页面返回顶部

Troverld

博客渲染出问题了那是博客的锅，本人什么都不会做的。