策略思维

第一章一些策略故事

领先还是不领先

帆船比赛给我们提供了一个很好的机会，观察“跟随领头羊”策略的一个很有意思的反例。成绩领先的帆船，通常都会照搬尾随船只的策略。一旦遇到尾随的船只改变航向，那么成绩领先的船只也会照做不误。实际上，即便成绩尾随的船只采用一种显然非常低劣的策略时，成绩领先的船只也会照样模仿。为什么？因为帆船比赛与在舞厅里跳舞不同，在这里，成绩接近是没有用的，只有最后胜出才有意义。假如你成绩领先了，那么，维持领先地位的最可靠的办法就是看见别人怎么做，你就跟着怎么做。（这一策略在竞争者超过两个后就不适用了，因为如果落后的两条船只做出了相反的动作，成绩领先者就得做选择）。

跟在别人后面第二个出手有两种办法：

一是一旦看出别人的策略，你立即模仿，好比帆船比赛的情形；
二是再等一等，直到这个策略被证明成功或者失败之后再说，好比电脑产业的情形。而在商界，等得越久越有利，这是因为，商界与体育比赛不同，这里的竞争通常不会出现赢者通吃的局面。结果是，市场上的领头羊们，只有当它们对新生企业选择的航向同样充满信心时，才会跟随这些企业的步伐。

直奔牢房

囚徒困境的故事体现了一个普遍的现象：大多数经济的、政治的或社会的博弈游戏都跟类似橄榄球或扑克这样的博弈游戏不同。橄榄球或扑克是零和博弈：一个人的得就是另一个人的失。但在囚徒困境中，有可能出现共同利益，也有可能出现利益冲突；不招供的结果对两个囚徒都是有利的，而不是相反。与此类似，在劳资双方的讨价还价中，虽然存在利益冲突，一方希望降低工资，而另一方要求提高工资，不过，大家都知道假如谈判破裂而导致罢工，双方都将遭受更大的损失。任何一个关于博弈的有用的分析，都应该考虑到怎么处理冲突与利益同时存在的情况。我们通常将博弈游戏的参加者称为“对立者”，不过，有时候，策略可能将原本毫不相干的人变为一条绳上相互依存的蚂蚱。

我将坚持到底

在实践中，“坚持到底，拒不妥协”说起来容易做起来难，理由有二：

第一个理由在于，讨价还价通常会将今天谈判桌上的议题以外的事项牵扯进来。大家知道你一直以来都是贪得无厌的，因此以后不大愿意跟你进行谈判。又或者，下一次他们可能采取一种更加坚定的态度，力求挽回他们认为自己将要输掉的东西。在个人层面上，一次不公平的胜利很可能破坏商业关系，甚至破坏人际关系。实际上，传记作者戴维·舍恩布伦(David Schoenbrun)这样批评戴高乐的盲目的爱国主义：“在人际关系当中，不愿给予爱的人不会得到爱；不愿做别人朋友的人到头来会一个朋友也没有。戴高乐拒绝建立友谊，最后受伤的还是法国。”一个短期妥协可能从长期来看会是一个更好的策略。
第二个理由在于达到必要程度的拒不妥协并不容易。路德和戴高乐通过他们的个性做到了这一点。不过这样做是要付出代价的。一种顽固死硬的个性可不是你想有就有，想改变就能改变的。尽管有些时候顽固死硬的个性可能拖垮一个对立者，迫使他做出让步，但同样可能使小损失变成大灾难。

给猫拴个铃铛

老鼠们意识到，假如可以在猫脖子上拴一个铃铛，那么，它们的小命就会大有保障。问题在于，谁会愿意冒赔掉小命的风险给猫拴上铃铛呢？

这个问题同样摆在老鼠和人类面前。占据支配地位的党派或独裁暴君怎样才能通过规模相对较小的军队长期控制数目很大的一个人群呢？整架飞机的众多乘客为什么只要出现一个持枪劫机者就会显得无计可施，束手就擒？在这两个例子里，只要大多数人同时采取行动，就很容易取得成功。不过，统一行动少不了沟通与合作，偏偏沟通与合作在这个时候变得非常困难，而压迫者由于深知群众的力量有多大，还会采取特殊的措施，阻挠他们进行沟通与合作。一旦人们不得不单独行动，希望聚沙成塔，集腋成裘，问题就出来了：“谁该第一个采取行动？”担当这个任务的领头人意味着要付出重大代价，甚至可能付出生命。他得到的回报则会是死后的光荣或受人感激。确实有人在想到责任或荣誉的时候会感到热血沸腾，挺身而出，但大多数人还是认为这么做的代价超出了得益。

涉及超过两个人的囚徒困境，可以把它称为“人质困境”。现在我们要用这个困境阐述一个不同的观点，确切地说，就是惩罚经常压倒回报而处于上风。独裁者可以通过向大众提供物质乃至精神安慰保持局势稳定，不过，这个做法可能需要付出高昂代价。建立在人质困境之上的压迫和恐吓可能是一种代价小得多的替代选择。

楔子的尖端

许多国家运用关税、配额以及其他方法限制进口，保护本土产业。这样的政策会抬高价格，损害国内所有使用受保护产品的消费者的利益。经济学家估计，假如美国运用进口配额保护钢铁、纺织或制糖产业，导致大家不得不购买价格更高的产品，换算过来，相当于每保住这些产业一个职位，美国国内其他人就要付出10万美元的代价。为什么会这样，极少数人的得益怎么总是会压倒更大多数人的损失而得到优先考虑呢？

秘诀在于一次提出一件事情。首先，美国制鞋产业的1万个职位面临着威胁。要想挽救这些职位，国内其他人就得付出10亿美元，或人均付出4美元。谁不愿意付出4美元保住1万个职位呢？即便素昧平生的陌生人也会愿意的吧，尤其是在可以把所谓不择手段的外国人当做现成的诅咒目标之际。接着就轮到服装产业、钢铁产业、汽车产业，等等。没等我们明白过来，我们已经点头同意付出500多亿美元，相当于人均付出200多美元，或每个家 1000多美元。假如我们事前可以看穿整个过程，我们大概会想，这个代价是不是太高了，继而坚持要让上述各个产业的工人自己承担国际贸易带来的风险，就像他们承担任何其他经济风险一样。就个案逐项进行决策可能导致全部结果都与我们的意愿南辕北辙。实际上，一项决定即便获得多数人投票赞成，仍然有可能导致一个在每个人看来都比现状更糟的结果。

三思而后行

人们陷入某种境地而发现从此难以脱身的情况实在是太普遍了。比如，一旦你在某个城市找到一份工作，那么，换一个地方重新安置下来的代价就会变得很高；一旦你买了一台电脑，学会了怎样使用其操作系统，那么，学会另一种操作系统，改写你的全部程序，其代价就会变得很高。同样，参加了一家航空公司的里程积分计划的旅行者若想搭乘另一家航空公司的飞机，付出的代价也会更高。还有，当然了，从婚姻围城中逃脱出来的代价也很高。问题在于，一旦你做出了类似的承诺，比如接受了工作或结了婚，你的讨价还价地位就会被削弱。公司大可以利用其职员预期的搬家成本高，向他们支付较低薪水或降低加薪幅度。电脑公司可以给新出的可兼容的外围设备标出更高的价码，因为它们知道，它们的消费者不会轻易转向同样是新出的却不兼容的技术。至于航空公司，一旦找到数目庞大的里程积分计划参加者，就不大愿意参与价格战了。夫妻签订的平均分担家务的协议一旦遇到小孩出生，就不得不重新谈判一番。

多管齐下

随机策略的重要性是博弈论早期提出的一个深谋远虑的观点。这个观点本身既简单，又直观，不过，要想在实践当中发挥作用，我们还得做一些细致的设计。比如，对于网球运动员，光是知道应该多管齐下，时而攻击对方的正手，时而攻击对方的反手，这还不够。他还必须知道他应该将30%的时间还是64%的时间用于攻击对方的正手，以及应该怎样根据双方的力量对比做出选择。

别跟笨蛋对等打赌

《红绿男女》中赌徒斯凯想起他父亲给他提的建议：孩子，在你的旅途中，总有一天会遇到一个家伙走上来，在你面前拿出一副新扑克，连塑料包装纸都没拆开的那种，赌他有办法让梅花J从扑克牌里跳出来，并把苹果汁溅到你的耳朵里。不过，孩子，千万别跟这个家伙打赌，因为就跟你站在那里一样，最后你会落得苹果汁溅到耳朵里的下场。

其他人的行动向我们提示了他们究竟知道什么，我们应该利用这些信息指导我们自己的行动。当然，我们应该将这些信息连同我们自己有关这个问题的信息综合起来加以利用，运用全部策略机制，尽可能从其他人那里获取整个事情的真相。

博弈论可能危害你的健康

两名美国经济学家找了一辆出租车，告诉司机应该怎么去他们的酒店。司机几乎立即认出他们是美国观光客，因此拒绝打表，声称自己热爱美国，许诺会给他们一个低于打表数目的更好的价钱。自然，两人对这样的许诺有点将信将疑。在他们表示愿意按照打表数目付钱的前提下，这个陌生的司机为什么要提出这么一个奇怪的少收一点的许诺呢？他们怎么知道自己有没有多付钱呢？（假如这个司机想要证明他确实打算少收车钱，他完全可以按乘客的要求打表，等到了目的地后按照打表数字收取80%的钱，但他没有打表，这其实已经扭曲了他的真实动机，参看前面斯凯的故事）。在到达酒店后，司机要求他们支付2500谢克尔，两位经济学家还价2200谢克尔。司机生气了，不等对方说话就锁住车门开到出发点，把他们扔出车外，大叫：“现在你们自己看看那2200谢克尔能走多远吧！” 他们又找了一辆出租车，这名司机开始打表，当跳到2200谢克尔时，他们到了酒店。

毫无疑问，花这么多时间折腾对于两位经济学家来说还值不到300谢克尔。另一方面，这个故事却很有价值。它描述了跟那些没有读过我们这本书的人讨价还价可能存在什么样的危险。更普遍的情况是，我们不能忽略自尊和失去理性这两种要素。有时候，假如总共只不过要多花20美分，更明智的选择可能是到达目的地之后乖乖付钱。这个故事还有第二个教训。设想一下，假如两位经济学家是在下车之后再来讨论价钱问题，他们的讨价还价地位该有多大的改善。(当然了，若是租一辆出租车，思路应该与此完全相反。假如你在上车之前告诉司机你要到哪里去，那么，你很有可能眼巴巴看着出租车弃你而去，另找更好的主顾。记住，你最好先上车，然后告诉司机你要到哪里去。)

红色算我赢，黑色算你输

在这个关于轮盘赌的故事里，先行者处于不利地位。由于那名女子先下注，巴里可以选择一个确保胜利的策略，即模仿女子的做法。假如巴里先下注，那名女子就可以选择一个具有同样取胜机会的赌注。这里需要说明的是，在博弈游戏里，抢占先机、率先出手并不总是好事。因为这么做会暴露你的行动，其他参与者可以利用这一点占你的便宜。第二个出手可能使你处于更有利的策略地位。

第二章准备接招

两种互动策略

策略博弈的精髓在于参与者的决策相互依存。这种相互影响或互动通过两种方式体现出来：

第一种方式是相继发生，参与者轮流出招。每个参与者在轮到自己的时候，必须展望一下他的这一步行动将会给其他人以后的行动造成什么影响，反过来又会对自己以后的行动造成什么影响
第二种互动方式是同时发生，参与者同时出招，完全不理会其他人刚刚走了哪一步。不过，每个人必须心中有数，知道这个博弈游戏存在其他参与者，而这些人反过来也非常清楚这一点，如此类推。因此，每个人必须设想一下若是自己处在其他人的位置，会做出什么反应，从而预计自己这一步会带来什么结果。他选择的最佳策略也是这一全盘考虑的一个组成部分。

一旦你发现自己正在玩一个策略博弈，你必须确定其中的互动究竟是相继发生的还是同时发生的。有些博弈，比如橄榄球，同时具备上述两种互动元素。这时候你必须确保自己的策略符合整个环境的要求。

策略的第一法则

相继出招的博弈有一个总的原则，就是每一个参与者必须预计其他参与者接下来会有什么反应，据此盘算自己的最佳招数。这一点非常重要，值得确立为策略行为的一个基本法则。

法则1：向前展望，倒后推理。展望你的最初决策最后可能导致什么结果，利用这个信息确定自己的最佳选择。

决策树与博弈树

一系列需要向前展望、倒后推理的决策，甚至有可能出现在一个孤立的决策者面前，而这个人并非置身于一个有其他人参加的策略博弈中。

我们遇到一个有两个人或更多人参与的博弈。沿着这棵树出发，后面许多分枝可能是几个参与者轮流决策。每个参与者在前一个分枝做决策时必须向前展望，而且考察的范围不应仅局限于他自己的决策，还要包括其他参与者的决策。他必须对其他人的下一步决策进行预计，办法就是置身于其他参与者的地位，按照他们的思维方式进行思考。为了强调一下这个做法与前面一个做法的区别，我们把一棵反映一场策略博弈当中的决策次序的树称为“博弈树”，而把“决策树”留做描述只有一个人参加的情形。

更加复杂的树

假如一个博弈无论选择哪一条路径，都会在有限次的行动之后到达终点，我们在理论上就可以完全解决这个博弈。这意味着能找出谁将取胜以及他将怎样取胜。这是通过沿着这棵树倒后推理得出的。一旦我们走通了整棵树，我们就会发现我们究竟能不能取胜，还有，假如可以取胜，我们应该使用怎样的策略。对于任何一个相继选择并且数目有限的博弈，总是存在某种最佳策略。当然，存在一个最佳策略并不等于说我们总是可以轻而易举地找到这个最佳策略。象棋就是一个很好的例子。

讨价还价

大多数人基于社会常识，预测一场谈判的结果就是妥协。这样做的好处是能够保证“公平”。我们可以证明，对于许多常见类型的谈判，一个50对50的妥协也是倒后推理的结果。首先，我们必须认识讨价还价的两个普遍特征。我们必须知道谁向谁提出了一个什么条件，换言之，就是这个博弈的规则是什么；接着，我们还要知道，假如各方不能达成一个协定，将会导致什么后果。

不同的谈判按照不同的规则进行。在大多数零售店里，卖方会标出价钱，买方的唯一选择就是要么接受这个价格，要么到别的店里碰运气。这是一个简单的“接受或者放弃”的法则。而在工资谈判的例子中，工会首先提出一个价码，接着公司决定是不是接受。假如公司不接受，可以还一个价码，或者等待工会调整自己要求的价码。有些时候，相继行动的次序是由法律或习俗决定的，还有一些时候这一次序本身就有策略意义。

谈判的一个必不可少的特征在于时间就是金钱。假如谈判越拉越长，蛋糕就会开始缩水。不过，这时各方仍然可能不愿意妥协，暗自希望只要谈成一个对自己更加有利的结果，其好处就将超过谈判的代价。

在一个典型的谈判过程里，蛋糕缓慢缩小，在全部消失之前有足够时间让人们提出许多建议和反建议。这表明，通常情况下，在一个漫长的讨价还价过程里，谁第一个提出条件并不重要。除非谈判长时间陷入僵持状态，胜方几乎什么都得不到了，否则妥协的解决方案看来还是难以避免的。不错，最后一个提出条件的人可以得到剩下的全部成果。不过，真要等到整个谈判过程结束，大概也没剩下什么可以赢取的了。得到了“全部”，但“全部”的意思却是什么也没有，这就是赢得了战役却输掉了战争。我们必须看到很重要的一点：虽然我们考虑过许多可能的建议和反建议，预期结果却是阿里的第一个条件能够被对方接受。谈判过程的后期阶段不会再发生。不过，假如第一轮不能达成一致，这些步骤将不得不走下去，这一点在阿里盘算怎样提出一个刚好足够引诱对方接受的第一个条件时非常关键。各得一半的分配方案存在什么规律吗？每一次的步骤数目都是偶数，且这一现象反复出现。更重要的是，即便步骤数目是奇数，随着步骤数目增加，双方也会越来越接近一半一半的分配方案。

这个观察结果反过来提示了另一种讨价还价策略。向前展望、倒后推理的原理可能在整个过程开始之前就已经确定了最后结果。策略行动的时间可能提前，在确定谈判规则的时候就已经开始。

同样的观察结果会引出一个谜。假如讨价还价的过程真像这里阐述的那样，应该不会出现罢工。当然，罢工的可能性会影响最终达成的协议，不过公司会把握第一个提条件的机会，提出一个刚好足以引诱对方接受的条件，工会也会这样做。罢工变成现实，或者更普遍的情况，即谈判破裂，一定是现实生活更微妙或者更复杂的特征引出的结果，而这些特征早已从上述这个简单的故事中排除出去，未予考虑，后续会讨论。

战争与和平

倒后推理的另一个实例是怎样通过一系列双边谈判维护和平。举个例子，苏丹是一个相对弱小的国家，现在面临被其邻国利比亚入侵的危险，假如这两个国家在某种程度上与外界隔绝，那么想要阻止利比亚入侵并击败苏丹简直毫无可能。两个敌对邻居可能无法继续和平共处，但第三方的存在也许可以构成必要的制约。在利比亚与苏丹的例子里，这一原理可能会是“我的敌人的敌人就是我的朋友”。

从表面看来，这个例子说明，一个国家究竟会不会遭到入侵，将取决于潜在侵略者链条的节点数目是奇数还是偶数。一个更加接近现实生活的情况分析可以把国与国之间的复杂关系考虑在内，从而得到更多细节，用于分析一国入侵别国的企图究竟有多大。不过，还有一个重要的结论：博弈的结果在很大程度上取决于参与者的人数。参与的人越多越好，参与的人越少越糟，即便在同一个博弈里也是如此。但是，两个敌对国家难以和平共处、三个敌对国家就能恢复稳定局面的结论并不意味着若有四个敌对国家就更好。

英国人玩的博弈

本章我们讨论了有序行动或者有序移动的博弈。实际上，现实生活当中没有几个博弈存在清晰界定而参与者又必须遵守的行动规则。参与者自己制定自己的规则。那么，他们怎么才能向前展望、倒后推理呢?他们又怎么才能知道这个博弈究竟有没有行动次序呢？

一个普遍的观点是若要运用向前展望、倒后推理的原理，不可缺少的前提是后行者可以观察到先行者的行动。向前展望、倒后推理原理的另一个适用条件：策略必须是不可逆转的。

假如这两个条件有一个不符合，又会怎么样？就策略思维而言，这些决定就跟同时做出没有两样。

假如你不得不冒一点风险，通常都是越早冒险越好。这一点在网球选手看来再明显不过了：人人都知道应该在第一发球的时候冒风险，第二发球则必须谨慎。这么一来，就算你一发失误，比赛也不会就此结束。你仍然有时间考虑选择其他策略，并借此站稳脚跟，甚至一举领先。

第三章看穿对手的策略

在同时行动的博弈里，没有一个参与者可以在自己行动之前得知另一个参与者的整个计划。在这种情况下，互动推理不是通过观察对方的策略进行，而是必须通过看穿对手的策略才能展开。你怎样才能看穿所有那些错综复杂而又看不见的策略呢？你不要把其他参与者的未知行动视做天气那样，具有与个人无关的不确定性。在同时行动的博弈中，我们有三个行动法则：一是寻找和运用优势策略；二是寻找和避免劣势策略，与此同时假设你的对手也在这么做；三是寻找和运用均衡。反过来，这些法则又基于两个简单概念：优势策略与均衡。

优势策略

优势策略的定义：某些时候它胜于其他策略，且任何时候都不会比其他策略差。

以策略观点来看，各方均有一个优势策略的博弈是最简单的一种博弈。虽然其中存在策略互动，却有一个可以预见的结局：全体参与者都会选择自己的优势策略，完全不必理会其他人会怎么做。但这一点并不会降低参与或者思考这种博弈的趣味性。比如，在百码短跑中，优势策略是能跑多快就跑多快，但许多人还是很喜欢参加或者观看这种比赛。囚徒困境中，两个参与者都有一个优势策略，只不过这股压倒一切的力量最终将他们引向了一起倒霉的结局。这就提出了一个很有意思的问题：参与者怎样合作才能取得一个更好的结果？

只有一方拥有优势策略的博弈其实也非常简单。拥有优势策略的一方将采用其优势策略，另一方则针对这个策略采用自己的最佳策略。

优势策略的两个特征：

“优势策略”的优势是指你的这个策略对你的其他策略占有优势，而不是对你的对手的策略占有优势。无论对手采用什么策略，某个参与者如果采用优势策略，就能使自己获得比采用任何其他策略更好的结果。
另一个常见的误解在于，一个优势策略必须满足一个条件，即采用优势策略得到的最坏结果也要比采用另外一个策略得到的最佳结果略胜一筹。但这并非优势策略的一个普遍特征。

法则2：假如你有一个优势策略，请照办。不要担心你的对手会怎么做。假如你没有一个优势策略，但你的对手有，那么就当他会采用这个优势策略，相应选择你自己最好的做法。

劣势策略

一个优势策略优于其他任何策略，同样，一个劣势策略则劣于其他任何策略。假如你有一个优势策略，你可以选择采用，并且知道你的对手若是有一个优势策略他也会照办；同样，假如你有一个劣势策略，你应该避免采用，并且知道你的对手若是有一个劣势策略他也会规避。假如你只有两个策略可以选择，其中一个是劣势，那么另一个一定是优势策略。因此，与选择优势策略做法完全不同的规避劣势策略做法，必须建立在至少一方拥有至少三个策略的博弈的基础之上。

法则3：剔除所有劣势策略，不予考虑，如此一步一步做下去。假如在这么做的过程当中，在较小的博弈里出现了优势策略，应该一步一步挑选出来。假如这个过程以一个独一无二的结果告终，那就意味着你找到了参与者的行动指南以及这个博弈的结果。即便这个过程不会以一个独一无二的结果告终，它也会缩小整个博弈的规模，降低博弈的复杂程度。

均衡策略

利用优势策略方法与劣势策略方法进行简化之后，整个博弈的复杂程度已经降到最低限度，不能继续简化，而我们也不得不面对循环推理的问题。你的最佳策略要以对手的最佳策略为基础，反过来从你的对手的角度分析也是一样。我们已经找到了一个策略组合，其中，各方的行动就是针对对方行动而确定的最佳对策。一旦知道对方在做什么，就没人愿意改变自己的做法。这称之为“均衡”。

法则4：寻找这个博弈的均衡，即一对策略，按照这对策略做，各个参与者的行动都是对对方行动的最佳回应。

为什么一个博弈的参与者非得达到这么一个结局呢？

首先，存在避免循环推理的必要，因为循环推理帮不上忙。均衡在没完没了的“我知道他知道我知道……”的循环里是稳定不变的，这使参与者对其他人的行动的估计能保持连贯性。各方正确预计别人的行动，并且确定自己的最佳对策。
均衡策略的第二个好处出现在零和博弈中。在这种博弈里，参与者的利益严格相悖。你的对手不能通过引诱你采取一个均衡策略而得到任何好处。你已经充分考虑到他们对你正在做的事情会有什么样的最佳对策。
第三个理由是，均衡方法注重实效。要想证明一个东西是布丁，就要吃一吃。综观全书，我们将会利用均衡方法讨论许多博弈。我们希望读者来检验它对博弈结果的预测以及这种思维方式产生的行为指导方针。我们相信，这么做会使我们提供的案例更有意思，比抽象地讨论均衡方法的优点更有意义。
最后，可能存在一个对均衡概念的误解，我们希望各位可以避免。当我们说博弈的结果是均衡，并不自动意味着这就是对博弈的全体参与者最有利的结果，更不意味着是对整个社会作为一个整体而言最有利的结果。有利或者不利的评价永远属于另外一个问题，答案视各个案例的具体情况而各有不同。

第四章走出囚徒困境

如何达成合作

一旦陷入囚徒困境，人们就会想方设法逃脱，寻求大家一致愿意看到的合作的结果。一个根本的难题在于在任何协定下参与者都有作弊的动机。因此，中心问题是，怎样才能觉察这么一种作弊行为？什么样的惩罚才能阻止这种行为？

觉察作弊

卡特尔作为一种企业联合组织，必须找出有效的办法，了解是不是出现了作弊行为，以及若是有作弊行为的话，确定是谁作弊。

合谋集中在比较透明的抉择层面，竞争则转向不那么容易看出来的层面，我们把这个现象称为“提高不透明度定律”。也许读者未必看得出来，但合谋仍然可能损害你的利益。比如，1981年开始实施日本汽车进口配额制度后，不仅包括日本车和美国车在内的全部汽车涨价了，而且大众化的日本车型也从市场上消失了。不透明的竞争后果更甚：不仅导致价格上升，产品组合的平衡也被扭曲了。

确认作弊者可能比觉察作弊更为艰巨。假如只有两个参与者，诚实的一方当然知道谁在作弊。即使如此，能不能让他承认错误可能又是一个未知数。假如出现不止两个参与者，我们可能知道有人作弊，却没人知道究竟是谁，只有作弊者自己心知肚明。遇到这种情况，用于惩罚的手段显得莽撞生硬，它会同时影响到无辜者和作弊者。

最后一点，作弊行为可能表现为维持被动，拒绝出头，因此也就更难区分出来。不肯带头倡议加税的例子就属于这个情况。遇到这种情况，想要推测或者断定有没有作弊更是难上加难。一方面，积极的行动人人都看得见，另一方面，不作为的借口也有很多，比如还有更加亟须处理的事情，需要时间动员全部力量，诸如此类。

对作弊者的惩罚

在每一个鼓励合作的良好计划里，通常都会包含某种惩罚作弊者的机制。一个坦白且供出合作伙伴的囚徒可能遭到这些人的朋友的报复。若是知道外面会有什么报应等着自己，尽快逃脱牢狱之灾的前景大概也就不会显得那么诱人了。在最初博弈之上增加惩罚机制的做法，其目的就是为了减少作弊的动机。

在博弈的结构里还存在其他类型的惩罚。一般而言，这种情况发生的原因在于这个博弈反复进行，这一回合作弊所得将导致其他回合所失。

无论一个博弈将会持续多长时间，只要大家知道终点在哪里，结果就一定是没人愿意合作。在现实世界里我们仍然可以找到阶段性的成功合作。有几个方法可以解释这一现象：

一是，这个类型的所有真实博弈只会反复进行有限次，但具体数目却没人知道。既然不存在一个确定的结束时间，那么这种合作关系就永远有机会继续下去。同时，参与者会有某种动机维持这种合作，为的是万一将来遇到不测，需要别人帮忙；假如这个动机足够强烈，合作就可以维持下去。
二是，这个世界存在一些“善良”的人，不管作弊可能带来什么样的物质利益，他们仍然愿意合作。现在让我们假设你没有那么善良，看看会出现什么情况。假如你按照自己的私心行事，那么在一个反复进行有限次的囚徒困境博弈里，你会从一开始就作弊。而这会使其他参与者看清楚你的本质。于是，为了掩盖真相，或者是至少掩盖一会儿真相，你不得不装出善良的样子。为什么你会那么做呢？假设你一开始就按照善良人的方式行事，其他参与者就会认为你大约属于周围少有的几个善良人之一。合作一段时间将会带来实实在在的好处，而且其他参与者也会打算仿效你的善良人的做法，换取这些好处。这对你也有好处。当然，你和其他参与者一样，仍然打算在博弈接近尾声的时候偷偷作弊。但你们仍然会在最初一个阶段进行互利互惠的合作。因此，在各人假装善良等待占别人便宜的时机的当口，大家都会从这种共同欺骗中得到好处。
三是，能在一个反复进行的囚徒困境中使信任出现的条件是，作弊所得早于合作破裂产生的代价之前出现。这么一来，两者相比哪一个更重要，就取决于现在与将来相比哪一个更重要。在商界，比较现在与将来的利润的时候，会用一个合适的利率对将来的利润打折扣。而在政界，现在与将来的重要性比较更加带有主观色彩，一般而言，下一次竞选之后的时间看起来无关大局。

惩罚的保证

最巧妙的方式在于通过一个保证加以惩罚的承诺推行一个价格联盟，而且是以竞争的名义进行。现在我们将要看到的是纽约市及其立体声音响商店大战。疯狂埃迪(Crazy Eddie)已经打出了自己的口号：“我们不能积压产品。我们不会积压产品。我们的价格是最低的——保证如此！我们的价格是疯狂的。”它的主要竞争对手纽瓦克与刘易斯，口号却没叫得那么野心勃勃。然而每次购物，你都会得到这个商店的“终生低价保证”。按照这一承诺，假如你在别的地方看到更低的价格，商店会按差价的双倍赔偿给你。

假设一台录像机的批发价是150美元，现在疯狂埃迪和纽瓦克与刘易斯都卖300美元。疯狂埃迪偷偷作弊，减价为275美元。假如没有那个击败对手的承诺，疯狂埃迪完全有可能将一些原本打算在对手那边购物的顾客吸引过来，而这些顾客之所以要去纽瓦克与刘易斯那边购物，原因很多，可能是因为路途较短或者以前曾在那里买过东西。不幸的是，对疯狂埃迪而言，这回减价起了完全相反的效果。因为纽瓦克与刘易斯有那么一条价格保证，人们就想赚便宜，纷纷进来买一台录像机，然后要求赔偿50美元。这么一来，相当于纽瓦克与刘易斯的录像机自动减价为250美元，比疯狂埃迪减得还厉害。

惩罚方式的选择

如果存在几个不同的惩罚手段，可以阻止作弊和维持合作，我们应该怎样抉择呢？有几个标准可供参考。

惩罚手段最重要的特征也许在于简单明确，这样的话，任何一个打算作弊的参与者都能很方便也很精确地算出作弊的后果。
接下来应该考虑的是确定性。参与者应该有信心，相信作弊者将受到惩罚，合作将会得到回报。
惩罚有多严厉。阻止作弊最可靠的方式在于使惩罚变得尽可能严厉。既然以惩罚进行威胁可以成功地维持合作，那么惩罚本身有多严厉就无关紧要了。但这一思路的问题在于，它忽略了出错的风险，如报告卡特尔内部有人作弊，但真正导致价格下跌的罪魁祸首确是一个完全不受控制的因素，那么这个错误的代价就会非常高昂。要想减小出错付出的代价，惩罚必须尽可能轻微，刚刚能阻止作弊就够了。最低限度的惩罚可以达到阻止作弊的目的，又不会在不可避免的差错出现时招致任何额外代价。

第五章策略行动

无条件行动

设想美国和日本争先恐后发展高清晰度电视，虽然美国拥有技术方面的优势，但由于财政赤字越积越高，可动用的资源有限。日本抓住美国这个短处，再次击败了它。不过一个乍看上可能进一步约束美国的策略性地其实可以扭转整个局面。在缺少无条件行动的前提下，每个国家必须决定对研发的投入是高还是低，投入高会缩短开发时间，但成本更高。在日本看来，自己选择高水平而美国选择低水平是最愿意看到的结果。而在美国看来，最理想的结果是双方同时选择低水平。低水平是美国的策略，而日本早已料到这一点，因此日本的对策是转向高水平。假设美国占了先机，日本还没来得及做出决定，美国已经抢先宣布自己无条件支持这一开发项目，这就使得原本同时出招的博弈变成了相继出招的博弈，而且还是美国先行。通过向前展望、倒后推理解出，美国会宣布选择高水平。

要想策略地行动，你必须保证自己不要采取在同时出招博弈里的均衡策略。美国的这个策略行动改变了日本的预期，进而改变了它的行动。一旦相信美国会不惜一切代价选择高水平，日本就会选择低水平。当然了，等到日本拿定了主意，美国最好还是改变主意，同样回到低水平的道路上去。

这就提出了几个问题：为什么日本应该相信美国的声明？它难道就不会预计到美国会改变主意吗？假如它料到美国会有这么一个改变，它还会选择高水平吗？

为了使一个策略行动可信，你必须采取其他附加行动，使扭转这一行动变得代价高昂乃至完全没有可能。可信度要求对这个策略行动做出一个承诺。

因此，策略行动包含两个要素：计划好的行动路线以及使这一路线显得可信的承诺。本章我们集中考察行动。

威胁与许诺

一个无条件的行动可以使这个参与者获得策略上的优势，抢占先机，率先出招。即便你并未真的先行，仍然可以通过对一个回应规则做出一个承诺，获得相仿的策略优势。回应规则把你的行为视为对其他人行动的一种回应。虽然你是跟在别人后面行动，但这个回应规则必须在别人开始行动之前就实施。父母对孩子说，“除非你吃掉菠菜，否则没有甜品”，实际上就是在确立一个回应规则。毫无疑问，这个规则必须在这个孩子把自己那份菠菜喂了小狗之前就开始实施，并且明确宣布出来。

回应规则分为两大类：威胁与许诺：

威胁是对不肯与你合作的人进行惩罚的一种回应规则，既有强迫性的威胁，比如恐怖分子劫持一架飞机，其确立的回应规则是假如他的要求不能得到满足，全体乘客都将死于非命；也有阻吓性的威胁，比如美国威胁说，假如苏联出兵攻击任何一个北约国家，它就会以核武器回敬。强迫性的威胁的用意在于促使某人采取行动，而阻吓性的威胁的目的在于阻止某人采取某种行动。两种威胁面临同样的结局：假如不得不实施威胁，双方都要大吃苦头。
许诺是对愿意与你合作的人提供回报的方式。为寻找证人，检察官会向一个被告许诺说，只要他愿意成为公诉方的证人，检举同案中的其他被告，他就会得到宽大处理。许诺同样可以分为强迫性的和阻吓性的两种。强迫性许诺的用意是促使某人采取对你有利的行动，比如让被告摇身一变成为公诉方的证人；阻吓性许诺的目的在于阻止某人采取对你不利的行动，比如黑帮分子许诺好好照顾证人，只要他答应保守秘密。相仿地，两种许诺也面临同样的结局：一旦采取(或者不采取)行动，总会出现说话不算数的动机。

有时候，威胁与许诺的界限非常模糊。一个人被抢劫，却得到如下的许诺：只要你“借给”我1000元，我许诺不会伤害你。

警告与保证

一切威胁与许诺的共同点在于：回应规则使你不会在没有回应规则的前提下采取行动。假如这个规则只是泛泛地指出，无论什么时候你都会采取最佳行动，那就跟没有规则差不多。由于别人对你以后的行动的预期毫无变化，这个规则也就产生不了任何影响。不过，说明什么事情会在没有规则的情况下发生，仍然具有一种公告天下的作用，这些说明被称为警告和保证。

如果实践一个“威胁”对你有利，我们称之为警告。如果实践一个“许诺”对你有利，我们称之为保证。

威胁与许诺是真正的策略行动，而警告与保证更多的是起一个告知的作用。警告或者保证不会改变你为影响对方而设立的回应规则。实际上，你只不过告知他们，针对他们的行动，你打算采取怎样的措施作为回应。与此截然相反，威胁或者许诺一旦时机来临，就会改变你的回应规则，使之不再成为最佳选择。这么做不是为了告知，而是为了操纵。由于威胁和许诺表明你可能选择与自身利益冲突的行动，这就出现了一个可信度的问题。等到别人出招之后，你就有动机打破自己的威胁或者许诺。为确保可信度必须做出一个承诺。

一种策略行动总是抢占先机的行动。回应规则必须在对方行动之前实施。这意味着无论策略行动是什么，整个博弈都必须当做相继出招的博弈进行分析。如果你永不妥协，那么其他人就会针对你的无条件的行动做出回应。借助威胁与许诺，你首先设立了一个回应规则，然后，其他人出招，而你按照自己的回应规则采取相应的行动。结果是，对行动或者回应规则做出的承诺使原本同时出招的博弈变成相继出招的博弈。虽然得失情况不会改变，同一个博弈若是按照同时出招或者相继出招方式进行，有可能产生完全不同的结果。结果的差异来源于不同的博弈规则。

核阻吓

曾经有超过40年的时间，北约一直在努力寻求一种管用的阻吓手段，遏制苏联入侵北欧。北约军队的常规防御手段不大可能奏效，其阻吓手段的一个基本要素在于美国的核力量。不过，动用核武器意味着给整个世界带来毁灭性的打击。那么该怎么办？苏联拥有先行之便。假如它不发动攻击，结果是保持现状，双方各得0分。假如它进攻北约，而北约以常规防御回应，那么，苏联得1分，美国得-1分。假如动用核武器进行回应，那么双方各得-100分。在这个博弈中，苏联向前展望，预计自己的进攻不会促使对方动用核力量反击。这么做的结果对美国不利。

北约在欧洲的成员国却一致觉得美国很有可能按照上述思路在它们需要援助的时候丢弃不管，它们希望美国做出一个可信的承诺，表明自己将在盟国遭到攻击的时候动用核武器。我们暂时放下可信度的问题，首先考察这么一个威胁产生作用的机制。现在，美国拥有先行之便，也就是说它率先提出自己的回应规则。这个相关规则就是如下威胁：“假如苏联进攻西欧，我们的回应就是动用核武器。”一旦美国实施威胁，苏联向前展望，意识到进攻将会引发对方动用核武器，苏联的结局将是-100分。它宁可保持现状，也不会发动攻击。现在，拥有先行之便的美国向前一直展望到底，就会发现自己若是实施这个威胁，得分是0，若不实施这个威胁，得分是 -1。可见，正是美国自身的利益，决定它要不要实施威胁。

美国的回应规则要求采取某种行动，而这一行动在从事之后判断显然不是最佳选择。其中的策略意图在于，以令人信服的方式改变苏联对美国事后采取什么回应的认识，可以使美国改变“这件事”——确切地说就是苏联要不要进攻西欧的决定。这个规则必须在对方采取你打算加以影响的行动之前生效。一旦被人占了先机，不管是无条件的行动，抑或威胁与许诺，都将无济于事。

你的无条件行动若是打算用来影响对方，就一定要让对方看到，同样，假如你打算通过威胁或许诺影响他的行动，那么他的行动也应该可以让你看到。否则你不可能知道他是不是选择顺从，而他也明白这一点。

杀鸡焉用牛刀？

在你做出一个许诺的时候，不应让自己的许诺超过必要的范围。假如这个许诺成功地影响了对方的行为，你就要准备实践自己的诺言。这件事做起来应该是代价越小越好，因此也意味着许诺的时候只要达到必要的最低限度就行了。不那么容易看到的是，适度原则其实同样适用于威胁。你不应让自己的威胁超过必要的范围。这么做的理由相当微妙。

为什么美国不会威胁日本说，假如日本不同意进口更多的美国大米、牛肉和柑橘，美国就要动武呢？虽然动武的想法有可能博得美国一些农场主和政治家的欢心，但同时却存在几个很好的理由，说明不能这么做：

没有人会相信这么一个威胁，因此这个威胁不会奏效。
哪怕这个威胁真的管用，日本也不傻，一定会重新揣摩美国究竟是不是它的盟友。
假如日本不肯进口更多柑橘，美国说到做到，当真实践自己的威胁，其他国家就会谴责美国选择了一个很不恰当的惩罚方式，日本更会怒不可遏。不过，假如美国不实践自己的威胁，又会让自己日后的信誉大打折扣。无论是不是实践自己的威胁，美国都将遭到失败。
这个威胁由于引入了一个本来毫不相干的因素——武力——而使原来的问题变得模糊不清。

上述各点的核心在于，这个威胁大而不当，对方难以置信，而自己又不能说到做到，更别说进一步确立自己的信誉了。

假如受到威胁的参与者知道反抗的下场，并且感到害怕，他就会乖乖就范。那么，我们为什么还要担心若实践这个威胁，会有多么可怕的情况发生呢？问题在于，在这个方面，我们永远不会遇到理想状况。只要我们仔细考察美国不能威胁动武的理由，我们就会看得更清楚，现实与理想状况究竟有什么区别。

首先，发出威胁的行动本身就可能代价不菲。国家、企业乃至个人都参加着许多不同的博弈，他们在一个博弈中的行动会对所有其他博弈产生影响。比如美国若是威胁对日本动武，就会影响到美国日后与日本的关系、目前和日后与其他国家的关系，而美国用过这么一个大而不当威胁的事情也会留在别人的记忆里。别人在和美国打交道时就会犹豫不决，美国则会失去许多其他贸易和伙伴带来的好处。
其次，一个大而不当的威胁即便当真实践了，也可能产生相反的作用。日本会惊慌失措地高举双手投降，请求世界舆论声援，谴责美国人民，从而将大大推迟有关谈判的进度；美国本来希望迫使它尽快开放国内市场，结果却适得其反。
第三，所谓一个成功的威胁完全不必实践的理论，只在我们绝对有把握不会发生不可预见的错误的前提下成立。假设美国错误地判断了日本农场主的势力，而他们宁可让国家投入战争也不愿失去自己受到保护的市场。又或者，假设日本同意美国的条件，可是美军某指挥官想起自己当初不幸沦为战俘的惨痛经历，咬牙切齿要进行报复，就会抓住这个机会贸然发动攻击。面对发生诸如此类错误的可能性，美国应该三思而后行。

结论是，能奏效的最小而又最恰当的威胁应该成为美国的首要选择，务必使惩罚与罪行相适应。如果美国希望刺激日本多买柑橘，就应该选择一个更具互惠性质的威胁，使惩罚与不肯多买柑橘的做法更加匹配。比如，美国可以威胁说要削减日本汽车或者电器的进口配额。

第六章可信的承诺

第5章描述的全部策略的根本目的在于，改变对手对你就他的行动可能做出什么回应的预计。假如他相信你不会实践你做出的威胁或许诺，这一目的就会落空。假如你不能影响他的预期，你就不能影响他的行动。建立策略意义上的可信度意味着你必须让别人相信你确实会实践你的无条件行动，你会信守许诺，也会实践你的威胁。可信度要求找到一个办法，有效阻止你反悔。

建立可信度的八正道

要想使一个策略行动显得很可信，你必须同时采取一个附加或从属的行动。我们把后一种行动称为承诺。现在，我们提供八种手段，以助于建立可信的承诺。

第一个原则是改变博弈的结果，意思是说，务必使遵守你的承诺成为符合你自身利益的选择：把威胁变成警告，把许诺变成保证。以下两种手段都能使破坏承诺的代价高于遵守承诺的代价。：

建立和利用一种信誉。
写下合同。

第二个原则是改变博弈，使你背弃承诺的能力大受限制。在这方面，我们考察三种可能性。最极端的做法莫过于剥夺自己反悔的机会，比如禁止自己走到反悔的地步，或断绝一切反悔的后路。甚至还有一种可能性，就是离开决策位置，听天由命：

切断沟通。
破釜沉舟。
让后果超出你的控制。

以上两个原则合并起来就是：可能的行动及其结果都有可能改变。假如一个大的承诺被分割为许多小的承诺，那么，违背其中一个小的承诺的得益很可能并不足以抵消失去余下承诺的损失。因此我们说小步前进。

第三个原则是充分利用别人，帮助自己遵守承诺。一个团队也许会比单独一个人更容易建立可信度。又或者，你可以考虑雇用其他人来做你的代表：

通过团队合作建立可信度。
雇用谈判代理人。

信誉

假如你在博弈当中尝试了一个策略行动，然后反悔，你可能就会丧失可信度方面的信誉。若是遇到百年一遇、千载难逢的情况，信誉有可能显得不那么重要，因此也没有多大的承诺价值。不过，一般情况下，你都会在同一时间跟不同对手进行多个博弈。因此你就有建立信誉的动机，而这就相当于做出一个承诺，以使自己的策略行动显得可信。

一个例子是以色列的一贯原则：坚决不跟恐怖分子谈判。这是一个威胁，意在阻吓恐怖分子，打消他们企图劫持人质，以此索取赎金或者要求释放犯人的念头。假如这个决不谈判的威胁是可信的，那么，恐怖分子就会意识到他们的行动注定徒劳无功。与此同时，以色列的决心也会经受考验。每一次，一旦这个威胁必须实践，以色列总会吃苦头；拒绝妥协可能使以色列人质命丧黄泉。每一次只要遭遇恐怖分子，以色列的信誉和可信度就会面临考验。屈服一次的意义绝不仅仅是满足眼下这批恐怖分子的要求那么简单，还会给以后的恐怖行动增添诱人的魅力。

对于承诺而言，信誉的影响是一把双刃剑。有时候，破坏信誉可能为达成一个承诺铺设道路。破坏你的信誉这一行动会使你跟你自己达成一个承诺，决心以后不再采取任何在你预计当中并不符合自己最佳利益的行动。

要不要跟劫机者谈判的问题有助于说明这个观点。在任何具体劫机事件发生前，政府可以做出决定，通过威胁说决不谈判，对劫机行动进行阻吓。不过，劫机者预计到，一旦他们夺取飞机，政府就会发现它根本不可能坚守绝不谈判的立场。政府怎样才能剥夺自己跟劫机者谈判的能力呢？一个答案是破坏其许诺的可信度。设想一下，在双方谈判达成协议后，政府却突然背弃自己的承诺，向劫机者发动攻击。这么做的结果是，政府对劫机者的处理方式值得信赖的信誉将会丧失殆尽。政府失去了做出一个可信的许诺的能力，同时不可逆转地断绝了自己对劫机者发出的威胁进行回应的后路。这种破坏许诺的可信度的做法将使决不谈判的威胁变得非常可信。

合同

要使你的承诺显得可信，一个直截了当的办法就是同意在你不能遵守承诺的时候接受某种惩罚。

合同方式更加适用于商业交易。违反合同一般都会造成破坏，因此，受害方一定不愿意善罢甘休。比如，一个制造商就可能要求一个没能按时送货的供应商支付罚金。这个制造商不会对供应商究竟有没有送货漠不关心。他更愿意得到的是自己订购的货物，而不是罚金。但是，单有合同并不能解决可信度的问题。若想奏效，还需要另外一些可信度工具，比如雇用对强迫执行或者他人信誉面临考验问题具有独立兴趣的人士。实际上，假如信誉影响足够大，可能根本没必要正式签订一份合同。这就是“一言既出，驷马难追”的意义。

切断沟通

切断沟通之所以可以成为一种管用的确保承诺可信的工具，原因在于它可使一个行动真正变得不可逆转。这一做法的一个极端形式是一份最后的遗嘱或者证词中的条款。一旦这一方死亡，再也没有进行再谈判的机会。

将切断沟通用做一个确保承诺遵守的工具，其中存在一个严重的问题。假如你被单独囚禁，与外界隔绝，那么，你要想确定对手是不是真的按照你的愿望行事，就算还不至于完全没可能，也是非常不容易的。你必须雇用其他人，确保合同得到遵守。比如，遗嘱就是由受托人而不是死者本人负责执行的。

破釜沉舟

军队通常借助断绝自己后路的做法而达成遵守承诺的目标。

人们没有必要按照字面意思当真烧毁桥梁或者连接各大洋的船只。人们可以通过采取一种可能惹恼某些选民的政治立场，从而象征性地切断自己的后路。

最后，建设而非烧毁桥梁也可能成为立下一个可信的承诺的办法。比如重新开放东西德国的桥梁，政府迫使自己一定要改革，否则就要冒人民大规模逃亡的风险了。

让后果超出你的控制

影片《奇爱博士》里，那台“末日毁灭机”由埋藏在地下的巨大原子弹组成，一旦引爆足以消灭地球上的所有生物。一旦苏联遭到入侵，这台机器会自动引爆。当美国总统询问这个自动引爆开关有没有可能被制造出来时，奇爱博士答：“不仅有可能，而且不可缺少。”

这台机器是一个绝妙的阻吓手段，它会使一切入侵变成自杀。本来，假如苏联遇到美国入侵，其总理很有可能犹豫，不愿意实施报复或者冒同归于尽的风险。只要苏联总理还有不作反应的自由，美国就有可能冒险发动进攻。现在有了这台“末日毁灭机”，苏联的反应将由这台机器自动做出，其阻吓的威胁也就变得可信了。不过，这一策略并非毫无代价。比如，很有可能发生一个小事故或者未经政府授权的小规模入侵，而苏联人其实也不愿实施报复，但他们毫无选择，因为采取行动的权力已经不在他们的手里。这也正是《奇爱博士》里发生的事情。

要想减小出错的后果，你一定希望找到一个刚好足够阻吓对手而又不会过火的威胁。假如行动不可分割，比如一场核爆炸，你该怎么办？你可以使你的威胁变得缓和一点，办法是创造一种风险，而不是一种确定性，表明可怕的事情有可能发生。这就是托马斯·谢林的边缘政策想法。

边缘政策是故意创造一种可以辨认的风险，一种人们不能完全控制的风险。这一策略在于有意将形势变得多少有点难以把握，其原因只是这种难以把握的形势在对方看来可能难以承受，因而被迫忍耐下来。这等于将敌人置于一个双方共担的风险之下对他进行干扰和威胁，又相当于是告诉他，假如他采取敌对行动，我们可能大为不安，以至于不管我们是不是愿意，我们都会越过边缘界线，采取行动与他同归于尽，从而对他进行阻吓。

小步前进

信任对方有时候意味着要冒很大的风险，在这种情况下，双方未必愿意互相信任对方。不过，假如承诺的问题可以减小到一个足够小的范围，那么，可信度的问题就能自动解决。威胁或许诺可以分解为许多小问题，每一个问题可单独解决。

就像边缘政策一样，小步前进缩小了威胁或许诺的规模，相应地缩小了承诺的规模。只有一点需要特别小心：深谙策略思维者懂得瞻前顾后，他们最担心最后一步。假如你预计自己会在最后一轮遭到欺骗，你应该提前一轮中止这一关系。不过，这么一来，倒数第二轮就会变成最后一轮，你还是没法摆脱上当受骗的问题。要想避免信任瓦解，千万不能出现任何确定无疑的最后一轮。只要仍然存在继续合作的机会，欺骗就不可取。因此，假如有一个可疑的家伙对你说，这是他在退休之前的最后一笔交易，你可得打起十二万分精神。

团队合作

其他人常常可以帮助我们立下可信的承诺。虽然每个人在独立行事的时候都有可能显得弱不禁风，但是大家团结起来就可以形成坚定的意志。

有时候，团队合作可以超出社会压力的范畴，通过运用一个强有力的策略，迫使我们遵守自己的许诺。

受托谈判代理人

假如一名工人声称自己不能接受任何低于5%的工资涨幅，凭什么老板应该相信他一定不肯退让而接受4%的工资涨幅呢？摆在桌面上的银子完全可以引诱人们回头再作一次谈判。如果这名工人有别人代为谈判，他的地位就会有所改善。工会领袖担任谈判者的时候，其地位可能不够灵活。他可能被迫坚守自己的许诺，否则就会失去工会会员的支持。这名工会领袖要么从其会员那里得到一份有条件的委托，要么公开宣布自己的强硬立场而使自己的声望面临考验。实际上，工会领袖变成了一个受托谈判代理人。他作为一个谈判者的权威建立在他的地位之上。有时候他根本无权妥协，批准合同的必须是工人们，而非这名工会领袖。有时候，这名工会领袖若是做出妥协，可能导致他下台走人。

第二种受托谈判代理人是机器。没有多少人会跟一台自动售货机讨论价格问题。

案例分析：你会不会宁可向IBM租一台电脑？

美国政府认为，IBM把重心放在短期租赁的做法设置了一道进入屏障，使其独享了垄断的好处。IBM辩解说这一做法完全是为了消费者利益着想。它认为，签订一份短期租赁合同后，消费者就不必担心自己使用的机器可能过时，从而享有灵活性，并且可以在需要的时候改变合同，同时还可在合同中规定由IBM负责保养出租的机器。许多人认为这番辩解令人信服。不过，租赁做法还有一个优势策略，双方似乎都没注意到，假如IBM对其大型计算机只是出售而绝不出租，你认为大型计算机的价格会有怎样的变化？

即便是一个没有外部对手的公司，也不得不担心怎样跟以后的自己竞争。每次推出一款新的计算机，IBM都能以非常高的价格把首批产品卖给那些迫不及待想尝试最新技术成果的消费者。一旦这款计算机的大批量生产可行，就会出现一种诱惑，促使公司降价，从而吸引更多消费者。生产这款计算机的主要成本在开发阶段已经发生了，此后每多卖一台，其所得基本上就是利润。这里有一个问题：假如消费者估计IBM差不多要降价了，他们就会稍等一下再购买。一旦大多数消费者都在观望，IBM就有动机加速减价进程，希望早日俘获消费者。这个想法首先是由芝加哥大学法学教授罗纳德·科斯提出的。他认为，对于耐用产品，一个垄断者实际上是在跟以后的自己竞争，从而使市场变得富有竞争性。

租赁做法作为一个承诺机制，使IBM得以维持较高的价格。租赁合同使IBM的降价成本大大增加。一旦它的机器短期出租，任何一次降价就都要告知全体消费者，而不仅仅限于那些尚未购买其机器的消费者。从现有消费者群体损失的收入，可能超过新的租赁合同带来的收入。相反，假如现有消费者群体拥有IBM的机器，这个结果就不会出现，因为已经花大价钱买下这台机器的消费者不会得到现金返还。这么一来，租赁做法变成一个小步前进的例子。前进的步幅等于租赁时间。租赁时间越短，步幅也越短。假如步幅太大，消费者就不相信IBM会把价格维持在较高水平；他们会等待降价，等一段时间就能以较低价格购买同样的机器。不过，假如IBM只在短期可续约租赁合同的基础上出租它的机器，它就能以相当可信的方式将价格维持在较高的水平，这时，消费者没有理由观望，IBM就能赚取较高的利润。

在教科书市场上也遇到了同样的问题。假如承诺有可能存在，出版商一定会通过每五年推出一部新版教科书的方式提高利润，而不是沿用现在通行的三年周期。周期越长，这部教科书在二手教科书市场上的价值就越高，相应地，新版推出之际学生的购买积极性也会越高。问题在于，一旦出现二手教科书，出版商就有很强的动机想通过推出新版削弱二手教科书的竞争。由于人人都知道这样的事情一定会发生，因此，学生们可以用较低的价格买到二手教科书，因而也就不那么愿意花钱购买新版了。出版商的解决办法与IBM的解决办法一样：应该出租教科书，而不是出售教科书。

第七章不可预测性

正确估计并回应不可预测性不仅在棒球场上非常有用，在其他领域也是一样。只要一方喜欢准确地预料将发生的事情，而另一方却竭力避免被预测，不可预测性就会变成策略的一个关键因素。实际上，选择投这种球而非那种球的概率，或者选择这人而非那人进行审核的概率，可以通过整个博弈的细节精确地确定下来。

怎样使输赢机会相等？

随机性存在一种均衡模式，必须加以计算。对于奇偶数游戏，两个50∶50混合策略对彼此都是最佳选择，它们合起来就是一个均衡。这一解决方案的名称叫做“混合策略”均衡，反映了个人随机混合自己的策略的必要性。若是换了其他更一般的情况，这个均衡混合的对称性就不会显得如此明显，但仍有一些简单规则可以用来计算

有人要打网球吗？

从两位选手的不同角度计算最佳混合策略，会得到一个有趣的共同点：两次计算会得到同样的成功回球率，即48%。接球者若采用自己的最佳混合策略，就能将发球者的成功概率拉低到发球者采用自己的最佳混合策略所能达到的成功概率。这并非巧合，而是两个选手的利益严格对立的所有博弈的一个共同点。这个结果称为最小最大定理，由前普林斯顿数学家约翰·冯·诺依曼与奥斯卡·摩根斯坦创立。这一定理指出，在零和博弈里，参与者的利益严格相反(一人所得等于另一人所失)，每个参与者尽量使对手的最大收益最小化，而他的对手则努力使自己的最小收益最大化。他们这样做的时候，会出现一个令人惊讶的结果，即最大收益的最小值(最小最大收益)等于最小收益的最大值(最大最小收益)。双方都没办法改善自己的地位，因此这些策略形成这个博弈的一个均衡。

最小—最大定理的普遍证明相当复杂，不过，其结论却很有用，应该记住。假如你想知道的只不过是一个选手之得或者另一个选手之失，你只要计算其中一个选手的最佳混合策略并得出结果就行。

所有混合策略的均衡具有一个共同点：每个参与者并不在意自己在均衡点的任何具体策略。一旦有必要采取混合策略，找出你自己的均衡混合策略的途径就在于使别人对他们自己的具体行动无所谓。虽然这听上去像是一种倒退，其实不然，因为它正好符合零和博弈的随机化动机：你想阻止别人利用你的有规则的行为占你的便宜。假如他们确实倾向于采取某一种特别的行动，从你的角度观察，这只能表示他们选择了最糟糕的方针。说到这里，我们已经解释了采取混合或者随机策略的好处，以及这么做的策略必要性。基本要点在于，运用偶然性防止别人利用你的有规则的行为占你的便宜。

为什么你应该选择正确的混合策略?

一旦接球者以为看穿了对方的惯用手法，而放弃自己的均衡混合策略，一心要占对方便宜，就会上发球者的当。发球者乍看起来很傻的混合策略可能只是一个陷阱。只有采取自己的均衡混合策略才能避免这一危险。

为什么不能依赖对手的随机化？

假如一个参与者选择的是他的最佳混合策略，那么，无论对手采取什么样的策略，他的成功率都是一样的。假设你是网球比赛例子里的接球者，而发球者已经选择了他的最佳混合策略，即40∶60的混合策略。那么，无论你向正手方还是反手方移动，又或是时而正手方，时而反手方，你的成功回球率都是48%。意识到这一点，你可能打算免掉计算自己的最佳混合策略的麻烦，只随便选定一种行动，并指望对手选择他的最佳混合策略。问题在于，除非你选择自己的最佳混合策略，否则你的对手就没有动机选择他自己的最佳混合策略。举个例子：假如你选择向正手方向移动，他会转向攻击你的反手方。为什么你应该选择自己的最佳混合策略？理由就是迫使对方继续使用他的最佳混合策略。

你的技巧变化了，你的最佳混合策略怎样变化？

随着接球者的技巧不断改进，他的成功率自然也会提高。不过，出人意料的是，这一提高了的成功率是由减少使用改进了的反手技巧取得的。在第1章的妙手传说中，我们说过这样的事情有可能发生；现在我们就来解释一下。原因在于两位参与者的策略的相互影响。当接球者更善于反手回球，发球者就会多向他的正手方发球(向正手发球的比率达到43%，而不是原来的40%)。为了适应这个变化，接球者也会多向正手方移动。反手技巧改进了，正手技巧的威力也因此释放出来。好比拉里·伯德的例子，随着他的左手投篮得分率上升，对方防守他的策略不得不发生同样的改变，结果反而给了他更多机会右手投篮。

怎样随机行动？

心理学家已经发现，人们往往会忘记这样一个事实，即投掷硬币翻出正面之后再投掷一次，这时翻出正面的可能性与翻出反面的可能性相等；这么一来，他们连续猜测的时候就会不停地从正面跳到反面，很少出现连续把宝押在正面的情况。

为避免一不小心在随机性里加入规律因素，我们需要一个更加客观或者更加独立的机制。一个诀窍在于选择某种固定的规则，但要是一个秘密的而且足够复杂的规则，人们很难破解。如可以看你的手表的秒针。假如你的手表不准，别人没办法知道现在秒针究竟处于什么位置。对于必须使自己的混合策略比例维持在50∶50的棒球投手，我们的建议是，每投一个球，先瞅一眼自己的手表。假如秒针指向一个偶数，投一个快球；假如指向奇数，投一个下坠球。实际上，秒针可以帮助你获得任何混合策略比例。比如，现在你要用40%的时间投快球而用另外60%的时间投下坠球，那么，请选择在秒针落在1～24之间的时候投快球，落在25～60之间的时候投下坠球。

独一无二的情况

考察一场战役攻守双方的选择。这种情况通常都是独一无二的，彼此都不能从对方以前的行动中得出任何规律。但是，派出间谍侦察的可能性会引出一个随机选择的案例。假如你选择了一个具体的行动方针，却被敌人发现了你的打算，他就能选择对你最不利的行动方针。你希望让他大吃一惊；最稳妥的办法就是让你自己大吃一惊。你应该留出尽可能长的时间考虑各种可能的方案，直到最后一刻才通过一种不可预测的从而也是不可侦察的方法做出你的选择。这个方法包含的相对比例应该符合这样的要求：敌人就算发现了这个比例，也不能以此占据上风。不过，这其实就是我们前面已经讲过的最佳混合策略。

最后给你一个警告。即便在你采用了自己的最佳混合策略的时候，你还是有可能得到相当糟糕的结果。

谎言的安全措施

假如你采用了自己的最佳混合策略，那么，另一个参与者能不能发现这一点无关紧要，只要他不能提前发现你通过自己的随机机制为某个具体情况确定的具体行动方针。对于你的随机策略，他无计可施，占不了你的便宜。均衡策略恰恰就是用来防止对方通过这样的方式占你的便宜。不过，假如出于某种原因，你没有采取自己的最佳混合策略，这时，保密就是关键。泄露这一信息会让你付出巨大代价。与此同时，你也有同样的机会使对手误解你的计划。

1944年6月，盟军筹备诺曼底登陆的时候，想方设法让敌人相信攻击点会在法国北部的港口加来。最具创意的一招，是把一个德国间谍变成一个双重间谍，却又不是一般的双重间谍。英国人费尽心机让德国人听说自己的间谍叛变了，却又不让他们知道这个消息是有意泄露的。为了使德国人知道自己作为一个双重间谍多么(不)可信，这个家伙向德国发回了一些最蹩脚的信息。德国人发现这些信息只要按照字面意思反过来理解就对了。这是关键的一步。当这名双重间谍报告说盟军将在诺曼底登陆时，他说的是实话，偏偏德国人反过来理解，认为这进一步确认了加来才是攻击点。这个策略还有一个优点，即盟军登陆之后，德国人再也摸不透他们的间谍是不是一个真正的双重间谍。他一直是德国仅有的正确信息来源。随着他在德国人那边的可信度逐步恢复，英国人可以通过他发出错误信息，引诱德国人上钩。这个故事的问题在于，德国人本来应该可以预计到英国人的策略，并分析得知他们的间谍有可能叛变。使用混合或者随机策略的时候，你不是每一次都能愚弄对手，也不是任何一个特定时候都能让他上当。你能得到的最好结果是让他们不断猜测，且有时候可以引诱他们上当。在这方面，当你知道正在和你交谈的人出于自己的利益会有误导你的想法的时候，最佳选择可能是忽略他所说的一切，而不是按照字面意思理解或者断定应该反过来理解。

行动确实胜过言语一筹。通过观察你的对手的行动，你就能判断他想跟你说的事情究竟有几分可以相信。从我们列举的例子中可以看到，你不能单单按照字面意思理解对手所说的事情。但这并不表示在你努力识破他的真实意图时，应该忽略他的行动。一方按照怎样的比例混合其均衡策略，关键取决于他的得益。因此，观察一个参与者的行动可以提供一些有关正在使用的混合比例的信息，同时这种观察也是一个很有价值的证据，有助于推断对手的得益。

出人意料

目前为止，我们还只是将随机策略的应用集中在参与者利益严格对立的博弈上。在某种程度上显得更出人意料的还是找出随机行动的均衡的可能性，即便博弈的参与者存在共同利益。遇到这种情况，混合自己的策略可能导致各方得到更差的结果。不过，仅仅是结果更差并不表示这些策略就不是一个均衡：均衡是一种描述，不是一项指示。

混合自己的策略的原因来自合作失败。这个问题只出现在缺乏一个独一无二的均衡的时候。欧·亨利小说《麦琪的礼物》(The Gift of the Magi)里的那对夫妻。“谁也不会计算”他们彼此的爱情，他们彼此都愿意——甚至迫切希望——为对方做出任何牺牲，换取一件真正配得起对方的圣诞礼物。德拉愿意卖掉自己的头发，为吉姆买一条表链，配他从祖先那儿继承下来的怀表，而吉姆愿意卖掉这块怀表，买一把梳子，配德拉的漂亮长发。假如他们真的非常了解对方，他们就该意识到，为了给对方买一份礼物，两人都有可能卖掉他或者她的心爱之物，结果将是一个悲剧性的错误。德拉应该三思而行，好好想想留下自己的长发等待吉姆的礼物会不会更好。同样，吉姆也不要考虑卖掉自己的怀表。当然，假如他们两人都能克制自己，谁也不送礼物，又会变成另外一种错误。

尽管这对夫妻的利益在很大程度上是一致的，但他们的策略还是会相互影响。德拉保住自己的头发而吉姆卖掉他的怀表是一种可能的均衡；各人的策略都是对对方策略的最佳回应。不过，若情况是德拉卖掉她的头发而吉姆保住自己的怀表，这也是一个可能的均衡。会不会存在一种彼此了解的共识，从而可在两种均衡中做出取舍呢？由于“出人意料”是礼物的一个重要特点，因此他们不会提前商量以达成共识。

混合策略有助于保住这个“出人意料”的特点，可要付出代价。不难发现，各人都用2/3的机会选择献出而以1/3的机会选择接受，也能达到一个均衡。出错的概率相当大：9次里面有4次，这对夫妻会发现对方卖掉了自己买礼物回来相配的心爱之物(正如欧·亨利的小说提到的那样)，有1次大家都得不到礼物。由于存在这些错误，平均得分(两人各得2/3分)还比不上原来两种均衡得到的结果，在这两种均衡当中，各有一方送礼物而另一方收礼物(施者得2分，受者得1分)。这和网球比赛的例子不同，在网球比赛的例子中，各方确实可以通过混合自己的策略提高成功率。

为什么会有这种区别？网球是一个零和博弈，选手们的利益严格相悖。他们在独立选择混合策略的比例时会取得较好的结果。而在《麦琪的礼物》里，两夫妻的利益在很大程度上是结合在一起的。因此，他们必须协调他们混合策略的比例。他们应该投掷一枚硬币，按照硬币翻出的结果决定谁该送礼物，谁该收礼物。这对夫妻有一个小小的利益矛盾：吉姆喜欢左上角的结果，而德拉喜欢右下角的结果。经过协调的混合策略可以使他们达成一个妥协，化解这个矛盾。若用一枚硬币决定谁送礼物而谁收礼物，那么各人的平均结果就都会变成1.5分。当然，“出人意料”这一元素也不存在了。

得势不饶人

到目前为止，我们提到的混合策略的例子几乎全都来自体育竞技场。为什么现实世界里见不到几个将随机行为应用到商界里去的例子呢？首先，假如企业文化说的是努力保持对结果的控制权，就不大可能推广让概率决定结果的主张。出了问题之后更是如此，因为随机选择行动的时候总会出现偶然问题。关键并不在于冒险策略总能成功，而在于冒险策略可以避免出现固定模式，并防止别人轻易预测自己的行动。

折扣券是运用混合策略改善企业业绩的一个例子。诸如可口可乐与百事可乐这样的竞争对手之间的折扣券策略博弈，其实就跟吉姆和德拉的合作问题极为类似。两家公司都想成为提供折扣券的公司。但是，假如他们同时这么做，折扣券就不能发挥原来设想的作用，两家的结局甚至会比原来更糟。一个解决方案是遵守一种可预测的模式，每隔半年提供一次折扣券，几个竞争者轮流提供折扣券。这个方案的问题在于，当可口可乐预计到百事可乐快要提供折扣券的时候，它就应该抢先一步提供折扣券。要避免他人抢占先机，唯一途径就是保持“出人意料”的元素，而这一元素来自一个随机化的策略。

在商界还有其他例子可以说明我们必须避免陷入一个固定模式，防止对手轻易预测我们的行动。一些航空公司向愿意在最后一分钟买票的乘客提供优惠机票。不过，这些公司不会告诉你究竟还剩下多少座位，而这个数字本来有助于你估计成功得到机票的机会有多大。假如最后一分钟所剩机票的数量变得更容易预测，那么乘客利用这一点占便宜的可能性就会大得多，航空公司也会因此失去更多本来愿意购买全价机票的乘客。

在商界，随机策略的最广泛用途在于以较低的监管成本促使人们遵守规则。这已经应用于从税收审计、毒品测试到付费停车计价器的许多领域，同时解释了惩罚不一定要和罪行吻合的原因。

由付费停车计价器记录的违章停车的典型罚金是正常收费标准的许多倍。设想一下，假如正常收费标准是每小时1美元，按照每小时1.01美元的标准进行处罚能不能让大家从此变得服服帖帖呢？有可能，条件是交通警察一定可以在你每次停车而又没向计价器投钱的时候逮住你。这样一种严格的监管方式可能变得代价高昂。交通警察的薪水将成为首要议题；此外，为了保证警方说到做到，必须经常检测收费机，这笔费用可能也是巨大的。监管当局有一个同样管用、代价又小的策略，就是提高罚金数目，同时放松监管力度。比如，罚金若是高达每小时25美元，这时候，哪怕25次违章只有1次会被逮住，已经足够让你乖乖付费停车了。一支更小型的警察队伍就能胜任这项工作，而收取的罚金也更接近弥补检测成本的水平。当局选择一种随机策略的原因在于这么做胜过任何有规则的行动：完全不监管意味着浪费稀缺的停车空间，而100%的监管的代价又高得难以承受。不过，处于另一方的停车者不一定也有一个随机策略。实际上，当局希望通过提高侦察的概率和罚金数目，规劝大家遵守停车规则。
随机毒品测试与监管付费停车有许多相同点。若让每位职员每天都接受毒品测试，从而确定是不是有人用了毒品，这种做法不仅浪费时间、费用高昂，且没有必要。随机测试不仅可以查出瘾君子，还能阻止其他人觉得好玩而以身试“毒”。这种做法虽然查出瘾君子的可能性不大，但罚金很高。
国税局的审查策略的一个问题在于，与被逮住的机会相比，罚金数目其实很小。假如监管属于随机性质，我们必须定出一个超过罪行本身的惩罚。规则在于，预期的惩罚应该与罪行相称，而这种心理预期应该将被逮住的概率考虑在内。

那些希望击败监管当局的人，也可以利用随机策略为自己谋利。他们可以将真正的罪行隐藏在许许多多虚假情报或罪行里（藏木于林），从而使监管者的注意力和资源大大分散，以至于不能有效发挥作用。比如，防空体系必须保证摧毁所有的入侵导弹，对进攻方而言，击败防空体系的一个办法是用假导弹掩护真导弹，一枚假导弹的成本远远低于一枚真导弹，除非防守方可以百分百识别真假导弹，否则防守方就不得不摧毁所有入侵导弹。

第八章边缘政策

我们普通人也会运用边缘政策，只不过不会产生那么深远的国际影响罢了。比如公司管理层与工会可能面临一场毁灭性的罢工，固执己见而不能达成妥协的夫妻可能离婚，意见不一的国会议员假如不能通过预算案，就会让政府关门：这些案例的双方其实都会用到边缘政策。他们故意创造和操纵着一个有着在双方看来同样糟糕的结局的风险，引诱对方妥协。

边缘政策是一个充满危险的微妙策略，假如你想成功地运用这个策略，你必须首先彻底弄明白它究竟是怎么一回事。要想透彻地理解边缘政策，关键在于，必须意识到这里所说的边缘不是一座陡峭的悬崖，而是一道光滑的斜坡，它是慢慢变得越来越陡峭的。

边缘政策的本质在于故意创造风险。这个风险应该大到让你的对手难以承受的地步，从而迫使他按照你的意愿行事，以化解这个风险。这么一来，边缘政策变成一个策略行动，属于我们在第5章介绍的类型。和其他任何策略行动一样，边缘政策的目的是通过改变对方的期望来影响他的行动。实际上，边缘政策是一种威胁，只不过属于非常特殊的类型。要想成功运用边缘政策，你首先必须了解其独特之处。我们通过三个问题分析这些独特之处：第一，为什么不直接用一种表示可怕结果一定会出现的确定性威胁你的对手，而只是借助一个单纯的风险来暗示可怕的结果可能出现？第二，最终确定风险是不是已经过去的机制又是什么？第三，这个风险的恰当程度应该如何把握？

为什么选择不确定性？

在美国希望苏联从古巴撤出导弹的前提下，肯尼迪为什么不直接威胁说，假如赫鲁晓夫不拆除那些导弹，他就会将莫斯科夷为平地？按照我们前面(第5章)介绍的术语，这将是一个令人信服的威胁；它必须具体说明对方退让的确切条件(将导弹撤回俄罗斯，还是装箱后搬上哈瓦那港的一条船)以及退让的最后期限。问题在于，在实践当中，这么一个威胁不会有人相信，赫鲁晓夫不相信，其他什么人也不会相信。不错，这个威胁中提到的行动将会引发一场全球性的核战争，但这个危险本身实在太夸张了，以至于让人难以置信。假如导弹没有在最后期限之前撤离，肯尼迪一定不愿意将整个世界夷为平地，而更加愿意考虑延长留给苏联的最后期限，推后一天，再推后一天，如此下去。

在第6章，我们讨论过提高威胁的可信度的几个办法。在目前这个案例的具体情况下，动用一个自动装置看来就是最有把握的一个办法。从理论上说，在理想的情况下，一切都会按照计划发生。一台自动装置的存在可以使这个威胁更加可信。结果赫鲁晓夫退让了，这个威胁不必付诸实践，世界就免遭了灭顶之灾。假如某个威胁一定会奏效，那么它永远不必付诸实践，其规模大小并不重要，当真实践起来会让你遭受多大伤害也没关系。不过，在实践中，这个威胁能不能按计划奏效你不可能有绝对把握。实际上，可能出现两种错误。第一，这个威胁可能失败。假设肯尼迪对赫鲁晓夫的心思的判断是完全错误的。赫鲁晓夫不肯退让，于是那台可怕的“末日毁灭机”就会自动启动，毁灭全世界，肯尼迪则会后悔当初居然安装了这么一个东西。第二，这个威胁即便在不应该付诸实践的时候也会实施。假设苏联退让，但这个消息传到“末日毁灭机”那里的时候偏偏晚了那么一点点。由于这样的错误永远可能出现，肯尼迪一定不肯依赖于任何一个实施起来代价惊人的威胁。赫鲁晓夫若是知道这一点，根本不会相信这样的威胁，从而这些威胁也就不能阻吓他或迫使他就范。肯尼迪可以宣称有这么一台自动发射机，这台机器已经得到授权，假如苏联直到星期一还没有将导弹撤出古巴，它就要自行向莫斯科发射导弹；不过，赫鲁晓夫可以肯定，肯尼迪一定还有一个象征更高授权的按钮，这个按钮可以撤销这台机器发出的发射命令。

虽然表明战争必然爆发的确定性的威胁并不能让人信服，但表明战争可能爆发的风险或概率却可以变得可信。假如赫鲁晓夫不肯退让，就会出现一种风险，而不是一种确定性，表明导弹可能发射。这种不确定性降低了这个威胁的程度，从而使美国觉得这个威胁比较容易承受，因此在苏联看来也更加可信。这跟我们在第6章提到的另一个提高可信度的办法相似，即小步前进。美国或苏联方面的每一次不让步都会加大爆发世界大战的风险；而他们的每一个小的让步则都会减少这个风险。假如肯尼迪愿意走得比赫鲁晓夫更远，那么肯尼迪的边缘政策就会取胜。肯尼迪不能令人信服地威胁说他马上就要发动一场全面的核打击，但我们还要考虑肯尼迪怎样才能以爆发战争的风险而不是爆发战争的确定性威胁对方。这里我们看到了前面提过的那道光滑的斜坡。

风险机制

怎样着手创造一个包含风险的威胁呢？在第7章，我们研究了有关混合行动的想法，提出了几种随机机制，若要从一系列混合行动中选择一个行动，我们可以借助这些机制进行选择。现在我们也可以尝试同样的办法。举个例子：假设在古巴导弹危机期间，肯尼迪要以爆发战争的风险威胁对方，这种风险合适的可能性应该是六分之一。接着，他可以告诉赫鲁晓夫说，除非苏联导弹在星期一之前撤出古巴，否则他就会投一个骰子，若是碰巧投出一个六，他就会下令美国军队发射导弹。不过，与这一幕隐含的可怕情景相反，这一招未必行得通。假如赫鲁晓夫就是不肯就范，而肯尼迪也确实投出了一个六，但实际决策权还是在肯尼迪的手里。在末日来临前，他会有一种强烈的愿望，想再给赫鲁晓夫一个机会，也就是再投一次骰子(“我们来一个三局两胜吧”)。赫鲁晓夫早就看穿了这一点，也知道肯尼迪同样明白这一点。于是这个威胁的可信度一定会丧失殆尽，就好像从来没人提过这个精心设计的投骰子决定的机制一样。

这里必须看到：当一座陡峭的悬崖被一道光滑的斜坡取代时，就连肯尼迪本人也不知道安全的界线究竟在哪里。这就好比他在玩一场核战争的俄罗斯轮盘赌，而不是投一个骰子。有一个数字会引发大灾难，但他并不知道究竟是哪个数字。假如当真出现这个数字，他不可能改变主意再投一次。在与理性的对手较量时，没人愿意越过核战争的边缘，却有可能由于一个错误而滑下那道光滑的斜坡。边缘政策创造了一种刚刚超出控制的情况，故意掩盖了那道悬崖。因此，边缘政策的风险与混合行动的概率元素存在根本区别。假如你的网球发球的最佳混合比例是正手和反手各占50%，而你在某一次特定发球前投一枚硬币，若是翻出正面，你没有理由感到高兴或不高兴。你对自己的每一次行动毫不在意；真正重要的是每一次的不可预测性以及正确的混合比例。而边缘政策则是你愿意在事实发生前创造这个风险，却在时机来临时不愿意将这个风险付诸实践。要想让你的对手相信你威胁的后果一定会发生，你还要借助其他一些渠道。

最常见的是采取超出你的控制的行动。这不是“假如你不服从我，就会出现我会这么做的风险”的问题。相反，这是“假如你不服从我，就会出现不管到时候你我会不会感到后悔不迭都会发生这样的事情的风险”的问题。因此，边缘政策的可信度离不开一个约定机制；只不过这个机制包含一枚硬币或一个骰子，用于决定究竟出现什么结果。这里引出了一个机器人或一台电脑按照骰子投出的数字自行行事的情形，但它却是一种不会变成现实的情形。不过，在许多情况下，担心“局势可能超出控制”的普遍的恐惧心理可以收到异曲同工之妙。肯尼迪没有必要确切说出世界末日的出现概率究竟有多大。

士兵和军事专家常常谈到“战争迷雾”，说的是双方在沟通中断、带有恐惧或勇敢的心里以及存在很大程度的普遍不确定性的情况下采取行动。同一时间发生的事情太多，因而没办法一直将每一件事都牢牢置于自己的掌握之中，这对于创造风险有一定帮助。古巴导弹危机本身就提供了这么一个例子：即使是总统也可能发现，一旦实施海上封锁，要想牢牢控制这一行动并不容易。肯尼迪想把封锁线从距离古巴海滩500英里处后撤到800英里处，目的是给赫鲁晓夫多留出一点时间，不过，美国人登上第一艘苏联的船进行检查的证据显示，封锁线从没移动过。海上封锁的标准操作可能会施加超出肯尼迪计划范围的风险，因此，很重要的一点是，认识到这种风险并非一个二人博弈，而苏联或美国也不能被看作是其中的一个个体参与者。肯尼迪的决策必须由自有一套程序的各方负责实施，这一事实使肯尼迪可以令人信服地表明确实会有一些事情超出他的控制。官僚机构自有一套行事方式，行动一旦发生就难以停止，以及组织内部存在相互冲突的目标，这些事实都是对肯尼迪有利的，他可以借此威胁说他要启动一个程序，而这个程序他自己也不能保证可以停止。

风险控制

《马耳他之鹰》影片里，斯佩德藏起了那只价值连城的鸟，而古特曼则绞尽脑汁要找出藏在哪里。斯佩德向这个来自地中海东部的家伙微微一笑，和气地答道：“你想要那只鸟吧。它在我的手里……假如你现在杀了我，你又怎能找到那只鸟？假如我知道你在得到那只鸟之前杀不了我，你又怎能指望吓唬我交出来？”古特曼的回应是解释他打算怎样使自己的威胁变得令人信服。“我明白你的意思。”古特曼格格笑了。“这是一种态度，阁下，需要双方拿出最敏锐的判断，因为你也知道，阁下，男人若是急了，很快就会忘掉自己的最大利益究竟是什么，任凭他们的情绪指挥自己，失去自制力。”古特曼承认他不能以处死的办法威胁斯佩德。不过，他可以让斯佩德面对一种风险，即局势可能在僵持到极点的时候超出控制。结果会是什么就说不准了。不是古特曼存心要杀斯佩德，只不过确实可能发生事故。而死亡又是不可逆转的。古特曼不能承诺假如斯佩德不肯招供，他就一定大开杀戒。但他可以威胁说要让斯佩德处于一种境地，在这种境地下古特曼自己也不能保证是不是可以防止斯佩德遇害。这种让某人了解自己遭受惩罚的概率的本事应该足以使这个威胁奏效，假如惩罚足够吓人的话。这么一来，斯佩德丧命的风险越大，这个威胁就越管用。不过，与此同时，这个风险也会让古特曼感到越来越难以承受，从而变得越来越难以置信。古特曼的边缘政策在且只在一个条件下奏效：存在一个中等程度的风险概率，它使这个风险大到足以迫使斯佩德说出那只鸟的藏身之处，却又小到让古特曼觉得可以接受。这么一个范围只在斯佩德重视自己的生命胜过于古特曼重视那只鸟的时候存在，这是因为，迫使斯佩德招供的风险(即死亡)小于阻止古特曼下毒手的风险(即失去宝贵的信息)。边缘政策不仅在于创造风险，还在于小心控制这个风险的程度。

现在我们遇到一个问题。许多创造风险的机制不允许对这个风险的程度进行足够精确的控制。我们前面已经看到肯尼迪是怎样运用内部政治和标准操作程序确保局势可能超出他的控制的，且局势不会由于肯尼迪自己有心退让而受到影响。不过，同样是这些事情，使他难以确保这个风险不会上升到连美国自己也感到难以承受的程度。肯尼迪自己估计的这个风险——概率介于三分之一与一半之间——是一个具有较宽范围的风险，不由得让人担心这个风险究竟能不能得到有效控制。对于这个两难问题，我们没有任何完美的或普遍有效的答案。边缘政策通常会是一个很管用的办法，却同样可能变成某种冒险经历。

逃离边缘

还有最后一个方面的控制，是使边缘政策发挥效力所不可缺少的因素。受到威胁的一方通过同意边缘政策者的条件，必须有能力充分减小这一风险，通常是一路减小到零。斯佩得必须得到保证，只要古特曼知道那个秘密，他的心情一定会马上平静下来，而赫鲁晓夫也必须得到确认，只要他一退让，美军马上会撤退。否则，如果无论你做或不做，你都会遭到惩罚，也就不存在什么退让的激励了。

跌落边缘

无论怎样运用边缘政策，总有一种跌落边缘的风险。虽然策略家们回顾古巴导弹危机的时候会把它当做边缘政策的一个成功应用，但假如超级大国之间爆发一场战争的风险变成现实，我们对这一案例的评价就会完全不同。若是真的爆发了战争，幸存者一定会责怪肯尼迪完全没有考虑后果，毫无必要地就把一场危机升级为一场灾难。不过，说到运用边缘政策，跌落边缘的风险经常会变成现实。

核边缘政策

欧洲人担心北约的核保护伞可能抵挡不住苏联常规军队的暴风骤雨的原因在于，因为核武器的威胁太大，如果它的使用是不合理的，那么这个威胁也不可能是合理的，一旦失去威胁的价值，核武器对阻吓小型冲突也就毫无价值。即使美国决心保卫欧洲，核武器的威胁遇到苏联的小型进攻，根本不可信。苏联可以运用每次切一小片的“意大利香肠”战术，钻核武器威胁的这个空子。

美国就苏联在欧洲的常规入侵发动核报复的威胁是边缘政策之一。有两个办法可以绕过被迫重新确定忍耐底线的问题。这两个办法边缘政策都会用到。首先，你要设法让惩罚措施的控制权超出你自己的控制，从而断绝你自己重新确定忍耐底线的后路。其次，你要将悬崖转化为一道光滑的斜坡。每向下滑一步都会面对失去控制而跌入深渊的风险。这么一来，你的对手若要用“意大利香肠”战术避开你的威胁，就会发现他自己将不断面对一个很小的遭遇灭顶之灾的概率。他每切下一小片香肠，无论这一片有多小，都有可能成为引发万劫不复灾难的最后一片。要使这种威胁变得可信，一个必不可少的要素在于，无论是你还是你的对手都不知道转折点究竟在哪里。

一个很小的遭遇灭顶之灾的概率可以具有和一个很小的遭受惩罚的必然性同样的威胁价值。美国通过创造一个风险，即哪怕政府本身竭尽全力防止，导弹还是可能发射出去的风险，成功地运用了边缘政策。美国的威胁能不能付诸实践与它本身的意愿无关。核武器的威胁在于可能出现意外事故。当存在任何常规冲突都有可能使局势激化到失去控制的可能性时，核阻吓就变得可信了。这一威胁不是一定发生，而是一种同归于尽的可能性。

核阻吓包含一个基本的得失结果。有能力发出同归于尽的威胁，本身就存在一种价值。毕竟，在人类进入核时代之后，我们享受了半个世纪没有爆发世界大战的和平。不过，把我们的命运交给概率去控制是要付出代价的。核阻吓要求我们接受某种同归于尽的风险。关于核阻吓的争论大部分集中在这种风险上。我们有什么办法可以降低爆发核战争的可能性，同时又不会削弱核阻吓的力量呢？诀窍同样在于确保这样的普遍化的风险控制在有效的与可接受的界限内。本章我们已就怎样做到这一点给出了一些提示，不过，完全成功的边缘政策仍是一门艺术和一种冒险。

第九章合作与协调

钟为谁而鸣？

许多学生一定也想和自己的同学在考试之前达成同样的协议。只要分数还是以一条传统的“钟形曲线”为基础，那么，你的相对排名就比绝对的知识水平来得更重要。这和你知道多少没有关系，有关系的只是别人比你知道得少。胜过其他学生的诀窍在于学习更多知识。假如大家都勤奋学习，也都掌握了更多知识，但相对排名以及底线——分数——在很大程度上依旧会保持不变。即便全班同学真的一致同意将春季学习限定为一天时间(最好是在雨天)，他们也会花较少的努力得到同样的分数。这些情况的一个共同特征在于，成功是由相对成绩而非绝对成绩决定的。假如一名参与者改善了自己的排名，那他必然使另一个人的排名变得差了。不过，一人的胜利要求另一人的失败的事实并不能使这个博弈变成零和博弈。零和博弈不可能出现所有人都得到更好结果的情况。但在这个例子中却有可能，收益范围来自减少投入，尽管胜者和败者的数目一定，但对于所有参与者而言，参加这个博弈的代价却会减少。

为什么(有些)学生学习过于勤奋，产生这个问题的原因是他们不必向其他学生支付一个价格或补偿。每个学生的学习好比一家工厂的污染，会使所有其他学生觉得更难以呼吸。由于不存在购买和出售学习时间的市场，结果变成一场称为“老鼠比赛”的你死我活的残酷竞争：每个参与者都极为用功，却没有什么机会表现自己的努力成果。不过，没有一支球队或一个学生愿意成为唯一一个减少这种努力的人，他们也不愿意带头减少这种努力。这就好比参与者超过两个的囚徒困境。要想逃脱这个困境的藩篱，需要一种可强制执行的集体协议。诀窍在于建立一个卡特尔，限制竞争。高校学生面临的问题是卡特尔不容易查出作弊行为。对于这个学生集体，作弊者就是那个花更多时间学习，企图跑到别人前面去的学生。很难说得清谁有没有偷偷学习，除非等到他们在测验里“一枝独秀”的那一天。但那时已经太晚了。在一些小镇，高校学生还真找到了一种办法，执行他们“不学习”的卡特尔协议：每天晚上大家聚集起来，在中央大街巡逻。谁若是在家学习而缺席，就会马上被发现，从而遭到排斥或更糟糕的惩罚。

很难安排一个自动执行的卡特尔协议。不过，若有一个外人专门负责执行这个限制竞争的协议，情况就会大为改观。而这正是香烟广告中发生的情况，虽然这一结果其实完全是无意造成的。过去，烟草公司经常花钱说服消费者“多走一英里”买他们的产品，或“宁可打架也不转换牌子”。这些各种各样的广告养肥了广告公司，但其主要目的却是防守——各家公司之所以做广告是因为其他公司在做广告。后来，到了1968年，法律禁止烟草广告在电视播放。烟草公司认为这一限制会损害它们的利益，要求废除。不过，等到迷雾散尽，烟草公司发现这一禁令实际上有助于它们免遭一起倒霉的下场，并且，由于烟草公司再也不必大笔花钱做广告，其利润状况因此大有改善。

那条人迹罕至的路线

从伯克利到旧金山，有两条主要路线可以选择。一是自行开车穿越海湾大桥，二是搭乘公共交通工具，即“海湾地区快速运输”列车，简称BART。穿越海湾大桥的路线最短；假如不塞车，只需20分钟。但这样的好事很少遇到。大桥只有4车道，很容易就发生堵塞。现在我们假定(每小时)每增加2 000辆汽车，就会耽搁正在路上的每一个人10分钟时间。比如，只有2000辆汽车的时候到达目的地需要30分钟；若有4000辆汽车，所需时间则延长至40分钟。 BART列车停好几个站，而且乘客必须走到车站等车。客观地说，这么走的话也要接近40分钟，但列车从不堵塞。若是乘客多了，公司就会加挂车厢，通行时间大致保持不变。假如在运输高峰时间有10000人要从伯克利前往旧金山，应该怎样将这些人合理分配到两条路线上去呢？每个人都会考虑自己的利益，选择最能缩短自己的旅行时间的路线。假如任由他们自己决定，40%的人会选择自行开车，60%的人会选择乘火车。最后大家的旅行时间都是40分钟。这个结果就是这个博弈的均衡。

这个均衡对作为一个整体的旅行者们来说是不是最好的呢？并非如此。我们很容易就能找出一个更好的模式。假定只有2000人选择走海湾大桥。他们每人可节省10分钟。至于另外2000名改乘火车的人，他们的旅行时间和原来开车的时候一样，还是40分钟。另外6000名继续选择乘火车的人也是同样的情况。

怎么有可能节省时间的呢？或者换句话说，为什么可以自行决定而不必受到一只“看不见的手”引导的旅行者不能自发达成最佳混合路线的结果呢？我们再一次发现，答案在于每一个使用海湾大桥者给其他人造成的损害。每增加一个旅行者选择海湾大桥，其他人的旅行时间就会稍微上升一点。但是这个新增加的旅行者不必为导致这一损害而付出代价。他只要考虑自己的旅行时间就行了。那么，这些旅行者作为一个整体的时候，什么样的旅行模式才是最佳模式呢？实际上，我们刚刚确定的那个模式，即2000人选择海湾大桥，总共节省20000分钟的模式，就是最佳模式。为了帮助理解这一点，我们再看另外两个方案。假如现在有3000人选择走海湾大桥，这就意味着3000辆汽车上桥，那么这一路线的通行时间就是35分钟，每人节省5分钟，但总共节省的时间只有15 000分钟。假如只有1000人选择海湾大桥，通行时间就是25分钟，每人节省15分钟，总共节省的时间一样，也只有15000分钟。2000人选择海湾大桥，每人节省10分钟的中间点就是最佳模式。

怎么才能达成最佳模式呢？

信奉中央规划者打算只发2000份使用海湾大桥的许可证，假如他们担心，这种做法不公平，因为持有许可证者只要30分钟就能到达目的地，而没有许可证的另外8000人则要花40分钟，那么他们可以设计一个精巧的系统，让这些许可证每月轮换一次，保证这10000人轮流使用。
一个以市场为基础的解决方案要求人们为自己对别人造成的损害付出代价。假定大家认为每小时的时间价值为12美元，换言之，大家愿意花12美元换取一小时时间。于是我们可以在海湾大桥设立收费站，收费标准比BART列车票价高出2美元。这是因为，按照我们假定的条件，人们认为每多花10分钟时间等于损失2美元。
一个更加接近自由企业精神的解决方案则是允许私人拥有海湾大桥。大桥所有者意识到人们愿意花钱换取一条不那么堵塞的路线，以节省旅行时间，因此就会为这一特权开出一个价。他怎样才能使自己的收入最大化呢？当然是要使节省的时间价值最大化。只有在“通行时间”标出价格的时候，那只“看不见的手”才能引导人们选择最优通行模式。一旦大桥上安装了利润最大化的收费站，时间就当真变成了金钱。搭乘BART列车者实际上是在向开车穿越海湾大桥者出售时间。

第22条军规？

QWERTY、汽油引擎以及轻水反应堆的选择只不过是历史问题怎样影响今日技术选择的三个证明。不过，历史上有过的理由到了今天可能成为无关的考虑因素。今天，在选择相互竞争的技术时，类似打字机键卡位、口蹄疫以及潜水艇的空间限制这样的问题与最终选择的得失已经毫无关系。来自博弈论的重要启迪在于，早日发现潜力，为明天取得优势做好准备，这是因为，一旦某项技术取得了足够大的先行优势，其他技术哪怕更胜一筹，恐怕也难以赶上。因此，假如早期花更多时间不仅研究什么技术能适应今天的需要，而且考虑什么技术最能适应未来，那么未来就可能获得很大的收获。

比超速驾驶传票还快

你要不要遵守速度限制？在这个博弈里，你的决定会与其他司机的决定发生互动。假如谁也不遵守这项法律，那么你有两个理由也违反这项法律：首先，一些专家认为驾驶的时候与道路上车流的速度保持一致实际上会更安全。在大多数高速公路上，谁若是开车只开到每小时55英里，就会成为一个危险的障碍物，人人都必须避开他。其次，假如你跟着其他超速驾驶者前进，那么你被逮住的机会几乎为零。警方根本没工夫去逮只占一个很小百分比的超速汽车，让它们统统停到路边，一一进行处理。只要你紧跟道路上的车流前进，那么总体而言你就是安全的。假如越来越多的司机遵守法律，上述两个理由就不复存在。这时，超速驾驶变得越来越危险，因为超速驾驶者需要不断在车流当中穿过来又插过去。而你被逮住的可能性也会急剧上升。

我们的意见是，假如谁也不肯以低于法律限制的速度行驶，你也不该那样做；假如人人遵守法律，你也应该遵守。在两条路线之间选择的那个案例中，整个动态过程趋向收敛于中间的均衡。而在这里，趋势变成朝向其中一个极端。之所以出现区别，原因在于互动的方式。在路线选择的案例中，一旦越来越多人跟随你的选择，无论你选择哪条路线，这条路线的诱惑力都会降低。而在超速行驶的案例中，跟随你的选择的人越多，这个选择的诱惑力就越高。

一个人的选择会影响其他人的普遍原理在这里同样适用。假如有一个司机超速驾驶，他就能稍稍提高其他人超速驾驶的安全性。假如没有人超速驾驶，那就谁也不想做第一个超速驾驶、为其他人带来“好处”的人，因为那样做不会得到任何“补偿”。不过，这里出现了一个新的变化：假如人人超速驾驶，谁也不想成为唯一落后的人。

立法者若是希望鼓励驾驶者遵守速度限制，他们可以从上述讨论中得到什么启示呢？不一定要把速度限制抬得很高，从而使大家乐于遵守。关键在于争取一个临界数目的司机遵守速度限制。这么一来，只要有一个短期的极其严格且惩罚严厉的强制执行过程，就能扭转足够数目的司机的驾驶方式，从而产生推动人人守法的力量。均衡将从一个极端(人人超速)转向另一个极端(人人守法)。在新的均衡之下，警方可以缩减执法人手，而守法行为也能自觉地保持下去。这一讨论隐含的更具普遍意义的启示在于，一个短暂而严厉的执法过程的效率，可能大大高于一个投入同样力量进行的一个长期而温和的执法过程。

他们为什么离开？

美国城市没有几个种族混合居住的社区。假如一个地方的黑人居民的比例超过一个临界水平，这个比例很快就会上升到接近100%。假如这一比例跌破一个临界水平，我们可以预计，这里很快就会变成白人社区。维持种族和谐居住需要一些富有独创性的公共政策。社会动力将一直推动整个社区向一个极端的均衡移动。谢林将这一现象称为“颠覆”。现在我们就来看看为什么会出现这种现象。

假定中间的均衡是70%的白人和30%的黑人。偶然地，一户黑人家庭搬走了，搬进来一户白人家庭。于是这一社区的白人比例就会稍稍高出70%。下一个搬进来的人也是白人的概率就会高于70%。这个新住户加大了向上移动的压力。假设种族混合比例变成75∶25。颠覆的压力继续存在。这时，新住户是白人的概率超过75%，我们可以预计整个社区将会变得越来越隔离。这一趋势将一直发展下去，直到新住户种族比例等于社区人口种族比例，这一情况只在整个社区变成全白人社区的时候出现。假如反过来，变化过程从一户白人家庭搬走而一户黑人家庭搬进来开始，就会出现相反方向的连锁反应，整个社区将会变成全黑人社区。

问题在于70∶30的种族混合比例不是一个稳定均衡。假如这一混合比例或多或少遭到破坏，而这是很有可能发生的事情，就会出现向其中一个极端移动的势头。令人遗憾的是，无论到达哪个极端，都不会出现类似的回到中间的势头。虽然隔离是一个早已料到的均衡，但这并不意味着人们会在这一均衡过得更好。每一个人大约都希望住在一个混居社区。但这样的社区几乎不存在，即便找到了多半也维持不下去。

这里我们再次看到，问题的根源在于一户人家的行动对其他人家的影响。从70∶30的比例开始，若有一户白人家庭取代一户黑人家庭，这个社区在打算搬进来的黑人家庭看来就会减少一分吸引力。但造成这一结果的人不会被罚款。用道路收费站打个比方吧，我们也许应该设立一个离开税。不过，这么做将与一个更具根本性的原则发生矛盾，这一原则就是选择在何处居住的自由。假如社会希望防止出现“颠覆”，就不得不另找其他政策方法。假如我们不能向一户打算搬走的家庭收缴罚金，说他们对仍然住在那里的住户以及现在可能不想搬进来的住户造成了损害，那么，我们就要采取措施，降低其他人跟随照搬的激励。假如一户白人家庭走了，社区不该就此对外面的另一户白人家庭减少一分吸引力。假如一户黑人家庭走了，社区不该就此对外面的另一户黑人家庭减少一分吸引力。公共政策有助于阻止这个颠覆过程加速。

芝加哥橡树园作为一个种族和谐混居社区，提供了一个绝妙的例子，说明了什么样的政策管用。这一社区采用了两种手段：一是该镇禁止在房屋前院使用写有“出售”字样的招牌，二是该镇提供保险，保证住户的房屋和不动产不会由于种族混合比例改变而贬值。假如很偶然地，同一时间在同一条街道上有两所房屋出售，“出售”的招牌就会将这一信息迅速传遍整个社区，传给可能的买家。取消这样的招牌使我们有可能藏起这种有可能被视为坏消息的信息；在这所房屋出售之前，没有人需要知道有这么一所房屋要出售。结果是避免了恐慌(除非恐慌有正当理由，在这个案例中恐慌只是被延迟罢了)。光有第一个政策并不足够。业主们可能还是担心，觉得他们应该趁着还能出手的时候卖掉自己的房屋。假如等到整个社区“颠覆”以后再卖，就拖得太久了，你很可能发现自己的房屋已经大大贬值。不过，假如该镇提供保险，这就不成问题了。换言之，这份保险消除了会加速颠覆过程的经济上的恐惧。实际上，假如这种保证可以成功阻止颠覆过程，不动产的价值就不会下跌，且这一政策完全不会加重纳税人的负担。

可能高处不胜寒

顶尖律师事务所通常会从自己内部资历较浅的同事当中选择合伙人，使之成为新的股东。没被选上的人必须离开，而且通常会转到一家不那么有名的律师事务所。在虚构的贾斯廷-凯斯律师事务所，选择标准是如此挑剔，以至于多年来根本选不出一个新股东。资历较浅的同事对职位停滞不前的状况提出抗议。股东们的回应则是推出一个看上去非常民主的新体系。以下就是他们的做法：到了一年一度的决定股东人选的时候，10名资历较浅的年轻同事的能力会按1到10打分，10分为最高分。这些资历较浅的同事私下得知了自己的最后得分，然后被请进一个大会议室，他们将在那里自行投票决定成为股东的必需得分。

他们一致认为，大家都能当上股东是一个好主意，当然他们更愿意回到从前人人都不是股东的日子。于是他们将必需得分定为1分。接着，其中一个得分较高的同事建议将必需得分定为2分。他的理由是这样可以提高整个股东团体的平均素质。这一建议得到9票赞成。唯一的反对票来自能力最差的同事，而这个人就这样失去了成为股东的资格。接下来，有人提议将标准从2分提高到3分。这时，还有8人得分高于3分，他们一致赞成这一改善整个股东团体的提议，只得到2分者的反对，因为这一提议使他失去了成为股东的资格。令人惊讶的是，得分最低的同事对提高标准的提议投了赞成票。无论这一提议能不能通过，他反正不能成为股东。不过，若是这一提议通过，他就能跟得分为2的同事一起成为落败者。这么一来，其他律师所虽然知道他落败了，却没办法搞清楚他究竟得了积分，有多大本事。他们只会猜测他可能得了1分或2分，而提高这一不确定性对他本人有利。于是，提高得分标准的提议以9票赞成、1票反对获得通过。

以后每通过一个新的得分标准，都有人建议提高1分。所有得分超过这一建议标准的人都会投票支持，希望提高整个股东团体的素质(而又不必牺牲他们自己的利益)，而所有得分低于这一建议标准的人也愿意投赞成票，希望自己的落选原因变得更加扑朔迷离。每一回合都只有一人反对，就是那个刚好处于现有得分标准、一旦建议通过就没有机会入选股东的同事。但他的反对以1∶9的悬殊比数败下阵来。如此下去，直到得分标准一路上涨为满分10分。最后，有人建议将得分标准提高为11分，因为这样一来就没人可以成为股东了。所有9分或低于9分的同事都觉得这个建议不错，因为这个建议和前面的建议一样，可以使落选者的平均素质看上去更好一些。外人不会认为他们当不上股东就是一个水平低劣的信号，因为这家律师事务所里面谁也没有当选。唯一的反对票来自能力最高的同事，他可不想失去成为股东的资格。可惜，他的反对以1∶9的比分落败，没能扭转局面。这一系列的投票，最后使每一个人都回到起点位置，他们认为这个结果比大家都得到提升的结果更糟糕。不过，即便如此，这一系列投票的每一个决议还是以9票赞成、1票反对的大比数通过。这个故事有两个启迪。

假如行动是一点一点推进的，那么，随着行动的逐步推进，每一步都有可能在绝大多数决策者眼里显得很有吸引力。但最后结果却使每一个人落得还不如原来的下场。理由在于，投票忽略了偏好的强度。在我们举的例子里，所有赞成者只获得一点点好处，而唯一的反对者却失去了很多。在这个包含10次投票的过程中，每一个资历较浅的同事都取得了9次小小的胜利，却在一次重大失败当中赔上了这些小小胜利带来的好处。
单单某一个人认识到了这个问题并不意味着一个人的力量就能阻止这个过程。这是一道光滑的斜坡，实在太危险了，谁也不应该走到那里去。这个团体作为一个整体，必须以一种协调的方式向前展望、倒后推理，然后确立规则，避免向那道斜坡迈出第一步。只要大家同意将改革视为一个一揽子方案，而不是一系列的小步行动，那就是安全的。有了一个一揽子方案，各人都知道自己最后将会到达什么位置。一系列的小步行动起先可能显得很诱人，但只要出现一个不利的转折，就可能足以抵消整个过程的得益。

1989年，美国国会在投票决定要不要为自己加薪50%的时候遭到失败，由此亲身领会了这一危险。最初，加薪看起来得到了参众两院的广泛支持。当公众听说他们的打算后，就向代表自己的国会议员发出了强烈抗议。结果呢，国会的每一位议员私底下都有了反对加薪的想法，假如他们以为即便自己投反对票，加薪提案也能获得通过。最好的结果当然是加薪提案在自己投反对票的情况下仍然获得通过。(对他们来说)不幸的是，国会有太多
贾斯廷-凯斯的案例还有一个非常不同的启迪。假如你将要遭到失败，你可能愿意败在一项艰巨的工作上。失败会使其他人降低他们对你的前途的期望。这个问题有多严重，取决于你究竟败在什么地方。没能跑完10公里显然会比没能爬上珠穆朗玛峰更容易遭到耻笑。关键在于，假如其他人对你的能力的了解确实非常重要，那么，你最好增大自己失败的机会，从而降低遭到失败的严重性。向哈佛而不是一般当地大学提出入学申请的人，邀请全校最受欢迎者而不是一个普通学生做你的正式舞会伴侣的人，采用的就是这一策略。

案例分析之九：牙医分布的解决方案

牙医会倾向于选择城市而不是农村，因为城市的牙医收入高于农村的牙医收入，但是随着城市牙医的增加，每个人收入会减少（竞争），所以会有一个均衡点。正如前面提到的选择交通方式的例子，这一均衡不能使牙医的收入总和达到最大。不过，社会不仅关注牙医行业的行医者，同样也关心消费者。实际上，假如不加干预，对于作为一个整体的社会，均衡点是最好的市场解决方案。理由在于，只要多一个牙医选择在城市行医，就会出现两个副作用。这个后来者会拉低所有其他牙医的收入，使所有正在行医的牙医受损。不过，降低价格对消费者倒是一件好事。两个副作用正好相互抵消。这种情况与选择交通方式的例子的区别在于，没有人会从海湾大桥堵塞导致行驶时间的增加中得到好处。假如副作用是价格(或收入)改变，那么购买者就会得到好处，生产者则会遭受相应的损失。这是一个净零效应(zero net effect)。

从社会的角度看，一个牙医不应该担心降低同行的收入。每一个牙医应该设法使自己的收入达到最高。由于每一个人都做出自利的选择，从而在不知不觉之间实现了牙医在城市与乡村的恰当的分布。于是，城市和农村的牙医都能得到同样的收入。假如能有多一些的牙医在乡村开业，那么，在城市行医的潜在优势就不会被竞争和拥挤“浪费”一空。从整体来看，假如我们有可能将城市牙医的数目维持在自由市场水平以下，那么牙医的收入总和就会提高。虽然牙医们不能向选择在城市行医者收取费用，不过，创立一笔基金用于补贴愿意投身乡村的牙科学生，倒是符合这个职业的利益的。

第十章投票的策略

民主政府的基石在于尊重人民通过投票箱表达的意愿。不幸的是，这些崇高伟大的想法实现起来并不那么容易。和其他类型的多人博弈一样，投票当中也会出现策略问题。投票者常常不愿表达自己的真实倾向。无论是少数服从多数的规则，或是任何其他投票机制，都不能解决这个问题，因为现在尚不存在一个完美无缺的体系，可以将个人的倾向会聚成人民的意愿。

爱一个可恶的敌人

其他情况下也会出现歪曲个人真实偏好的激励。一个例子是当你占有先行之利时，你就会抓住机会，以此对别人产生影响。以各基金会的慈善捐款为例。假定有两个基金会，各有25万美元的预算。它们收到了三份需要捐助的申请：一是来自一个组织，希望捐助无家可归者，二是来自密歇根大学，三是来自耶鲁大学。两个基金会一致认为向无家可归者捐助20万美元是它们的首选目标。至于其他两份申请，第一个基金会愿意向密歇根大学投入更多的钱，而第二个基金会比较偏爱耶鲁大学。假定第二个基金会抢先一步，将它的总预算中的25万美元全部捐给耶鲁大学，那么，第一个基金会别无选择，只好独力承担捐助无家可归者的责任，从自己的预算里拨出20万美元给他们，余下只有可怜的5万美元留给密歇根大学。假如两个基金会平均分摊捐助无家可归者的款项，那么，密歇根和耶鲁将各得15万美元。换言之，第二个基金会若是抢先行动，实际上通过迫使第一个基金会独立捐助无家可归者，将10万美元从密歇根大学转到耶鲁大学。从某种意义上讲，第二个基金会歪曲了自己的真实偏好，没有向自己的首选目标（无家可归者）捐助一分钱。不过这一策略承诺仍然服从它的真实利益，实际上，这一类型的资助博弈相对普遍。通过抢先一步，小型基金会可以施加更大影响，从而使原本排在第二位的捐助目标也能得到资助。大型基金会，尤其是联邦政府，落得别无选择的境地，只好资助最迫切需要资助的项目。

只要你可以指望别人以后会为你挽回局面，你就会有一种歪曲自己的真实偏好的激励，夸大自己的要求，利用他人的偏好做文章。你可能愿意冒着失去你自己想要的某种东西的风险获得某种好处，只要你还可以依靠别人承担挽回局面的代价。迫使他人为你挽回局面的原理，可以带来出其不意的结果，从你认为最糟糕的结果一直到你最满意的结果都有可能。

我们以一家公司的董事局为例进行说明。该公司面临敌意收购，董事们准备投票表决。他们的当务之急在于如何应对。一共提出了四种选择，每一种都有支持者。

该公司的创办人兼总裁希望找到一个保住该公司免遭分拆的办法。他的首选是在公司章程中加入一个“毒药”条款（指公司为免遭吞并而向对方索取极高代价的阻挠性条款）。这个“毒药”条款规定，任何外来者如果没有事先得到董事局的同意，不能取得该公司的控制权。
然而，董事局的两名年轻成员认为目前局势更加紧急。他们认为收购已经无法避免，从而希望集中精力寻求达成一个比较容易接受的收购合同。他们倾向于采取行动寻找一位白衣骑士，即该公司管理层和董事局一致认为比较容易接受的收购者。
管理层在董事局的代表则提出了第三种可能性，即目前在任的经理们愿意通过管理层出价收购(即MBO)，进而收购该公司。
董事局的第五名成员是一个来自外界的董事。他对于现在面临的收购持一种审慎乐观的态度，争辩说我们还有时间观察对方出价将会有什么变化。

不同人的偏好是顺序如下：

创办人：毒药、MBO、白衣骑士、坐等观望；
两名年轻董事：白衣骑士、毒药、坐等观望、MBO；
管理层：MBO、毒药、坐等观望、白衣骑士；
外来董事：坐等观望、白衣骑士、毒药、MBO；

面对这些选择，董事局必须做出抉择。每一个人都知道，投票过程很可能影响最后的结果。即便如此，他们还是认为，在决策过程中存在一个自然的次序：先是比较采取行动的积极方案，然后决定最佳方案是不是值得采纳。他们首先比较MBO与白衣骑士，然后取其中得票高者与毒药进行比较。若是确定了最佳行动方案，他们就要决定是不是值得采纳，是不是胜过坐等观望。

我们假定，5名董事局成员具备足够的远见，可以意识到自己在连续各轮投票中的行动会产生什么后果，并且按照他们的真实偏好进行投票。倒后推理使这个问题变得易于解决。你可以找到答案，发现白衣骑士方案将会最终胜出，不过，这不是我们讲这个故事的用意。我们的用意在于向读者解释创办人怎样通过做出一个歪曲偏好的承诺的办法，使最后结果在他看来有所改善。

白衣骑士方案怎么会在具有远见的投票中胜出呢？最后投票一定是在坐等观望与另外某种方案之间进行。而在这最后一轮投票中，每一个人都有诚实投票的激励，因为这将决定最后结果。很容易就能算出3种可能性：

坐等观望对毒药，毒药胜，4比1。
坐等观望对MBO，坐等观望胜，3比2。
坐等观望对白衣骑士，白衣骑士胜，3比2。

现在我们回到前一轮。对立双方要么是毒药对白衣骑士，要么是毒药对MBO。若是第一种情况，大家更倾向于毒药和白衣骑士，而不是坐等观望。因此，无论第二轮哪一个方案胜出，都会得到采纳。董事局成员喜欢白衣骑士胜于毒药，3比2。若是第二种情况，投MBO一票实际上等于投坐等观望一票。董事局成员可以预计到，假如MBO压倒毒药成为入选的行动方案，它将在下一轮与坐等观望较量时落败。因此，在决定究竟投毒药还是MBO一票的时候，董事局成员其实是在毒药和坐等观望之间进行选择，结果是毒药胜出，4比1。这么一来，第一轮较量实际上是在毒药与白衣骑士之间进行。白衣骑士以3比2的比分胜出，并且成为以后各轮的选择。

一旦创办人意识到将会发生什么事情，他有一个策略可以帮助他得到自己最想要的结果，即毒药。现在我们就来看一下，假如创办人“采纳”外来董事局成员的偏好，又会发生什么事情。当然了，他的这一偏好转变必须可信，而且要让所有其他投票者知道。假定创办人干脆把自己的投票权交给那位外来董事，自己离开了会议室。乍看上去，这么做简直就是疯狂，因为他将采纳的偏好几乎与他的真实偏好完全相反。但是看看效果吧。投票结果会变成下面的情况：

坐等观望对毒药，毒药胜，3比2。
坐等观望对MBO，坐等观望胜，4比1。
坐等观望对白衣骑士，坐等观望胜，3比2。

唯一可以压倒坐等观望的行动方案是毒药。从一开始，董事局成员就应该预计到，假如毒药也会输掉，最后结果就是坐等观望。不过，MBO和白衣骑士的支持者都倾向于毒药，而不是坐等观望。他们被迫投票给毒药，因为这是他们唯一可行的选择；于是毒药胜出。通过将自己的支持转向对立面，创办人有能力做出一个可信的威胁，说要么是毒药，要么是坐等观望。结果呢，除了死心塌地支持坐等观望的人，其他人统统抛弃了白衣骑士方案(因其不能击败坐等观望)，转而支持毒药方案。表面看来，这一票的改变使坐等观望的支持者的力量加倍，实际上却导致一个在他们看来更加糟糕的结果——毒药入选，而不是白衣骑士。当然，假如那位外来董事能够洞察这一博弈，他应该拒绝成为创办人的代理人。

第十一章讨价还价

几个有关讨价还价过程的重要问题：会不会达成一致？能不能友好地达成一致，还是非得来一场罢工不可？谁将得到双方争夺的这张利益大饼的多大部分？

我们从简要复习工会与管理层就工资展开的谈判的基本概念开始。为了做到向前展望、倒后推理，从未来某个固定点开始考察会比较方便，因此，现在就让我们设想一家拥有自然资源的公司，比如一个夏季度假村的酒店。其旺季持续101天。每开门营业一天，这家酒店就能赚到1000美元的利润。旺季开始之际，职工工会与管理层就工资问题发生矛盾。工会提出自己的要求。管理层要么接受，要么拒绝，并于次日提出一个反建议。酒店只能在达成一致之后开门营业。

工会每一次提出一个建议，它都有一个优势，而这个优势源于它是提出最后一轮全取或全失建议的一方。不过，这个优势随着谈判回合增加而逐步削弱。在一个持续101天的旺季开始之初，双方的地位几乎完全一样：505美元对495美元。假如管理层是提出最后一个建议的一方，或者没有严格规定，如限制每天只能提出一个建议，双方必须是交替提出建议，等等，双方的份额比例就差不多。我们之所以对交替提出建议加以限制，同时提出一个已知的期限，只是出于有助于大家向前展望的考虑。只要提议与提议之间相隔的时间很短，而讨价还价的期限又很长，这些条件就会变得无伤大雅——在上述情况下，向前展望、倒后推理将引出一个非常简单而又引人注目的法则：中途平分总额。

此外，谈判过程的第一天就会达成一致。由于双方向前展望，可以预计到同样的结果，它们就没有理由不达成一致，否则双方每天共损失1000美元。并非所有工会对管理层的讨价还价都会以圆满的结局收场。谈判破裂确实有可能发生，工人罢工或业主停业屡见不鲜，还有可能达成偏向其中一方的协议。但是，我们只要进一步分析前面提到的例子，对其前提做一些必要的修改，就能解释这些事实。

谈判中的锄强扶弱体系

决定如何划分利益大饼的一个重要因素是各方的等待成本。虽然双方可能失去同样多的利益，一方却可能有其他替代做法，有助于部分抵消这个损失。假定工会与管理层谈判期间，工会成员可以外出打工，每天挣300美元。于是，每次轮到管理层提出反建议的时候，出价不仅不能低于工会将在次日得到的收入，同时当天的数目至少要达到300美元。

在其他情况下，管理层也有可能处于有利地位。比如，管理层一边与工会谈判，一边发动不愿参加罢工的工人维持酒店营业。不过，由于这些工人的效率比较低或者要价更高，又或是由于某些客人不愿意穿越工会竖立的警戒线，管理层每天得到的营业收入只有500美元。假定工会成员在外面完全没有收入。这时工会愿意尽快达成协议，根本不会当真发动一场罢工。不过，发动不愿罢工者维持酒店营业的前景会使管理层处于有利地位，它将因此得到每天750美元的收入，工会只得250美元。

假如工会成员有可能外出打工，每天挣300美元，同时管理层可以在谈判期间维持酒店营业，每天挣500美元，那么，余下可供讨价还价的数目只有区区200美元。管理层最后得到600美元，而工会得到400美元。一个具有普遍意义的结论是，谁能在没有协议的情况下过得越好，谁就越是能从讨价还价的利益大饼中分得更大一块。

“这对你的伤害大于对我的伤害”

一旦一名策略谈判者发现，外部机会越好，他能从讨价还价当中得到的份额也越大，他就会寻找策略做法，希望改善他的外部机会。与此同时，他还会留意到，真正影响大局的是他的外部机会与他的对手的外部机会的相对关系。他即便做出一个承诺或威胁，导致双方的外部机会同时受到损害，也还是可以从讨价还价中得到更好的结果，前提是相比之下，他的对手的外部机会受到更严重的损害。

在我们提到的例子里，假如工会成员可以外出打工，每天挣300美元，而管理层则通过由不愿参加罢工者维持酒店营业，每天挣500美元，那么，讨价还价的结果是工会得到400美元，管理层得到600美元。现在，假定工会成员放弃外出打工的100美元，转而加强设置警戒线，阻止客人进入酒店，导致管理层每天少收200美元。于是，讨价还价一开始，工会的起点是200美元(300美元减去100美元)，管理层的起点则为300美元(500美元减去200美元)。两个起点相加得到500美元，正常营业所得利润1 000美元当中只余下500美元用于平均分配。结果，工会得到450美元，管理层得到550美元。工会加强警戒线的做法实际上等于做出要损害双方利益的威胁(只不过对管理层的损害更大)，它为此多得50美元。

边缘政策与罢工

在原有合同到期之前，工会与公司就会为达成一份新合同开始谈判。不过，这一期间没有理由着急。大家继续工作，产量方面没有损失，早一点达成协议与晚一点达成协议相比没有任何明显的好处。看上去双方都应该等到最后一刻，等到原有合同就要到期而罢工的阴云笼罩之际，再提出自己的要求。有时候确实会发生这样的事情，不过，人们通常都会更快达成协议。实际上，即便还在原有合同继续有效的平静时期，延迟达成协议也可能造成沉重的代价。谈判进程本身就存在风险。对于另一方的不耐烦、外部机会、紧张情绪或个性冲突，都有可能产生误解，同时怀疑对方没有老老实实进行讨价还价。哪怕双方同样希望谈判取得成功，谈判仍然有可能中途破裂。

虽然双方可能同样希望成功达成协议，但他们可能对什么是成功怀有不同的想法。双方向前展望的时候，并不总是看到同一结果。他们可能掌握不同的信息，看到不同的前景，于是采取不同的行动。各方必须猜测对方的等待成本。由于等待成本较低的一方能占上风，各方符合自身利益的做法，就是宣称自己的等待成本很低。不过，人们对这些说法不会按照字面意思照单全收；必须加以证明。证明自己的等待成本很低的做法是，开始制造这些成本，以此显示你能支持更长时间，或者自愿承担造成这些成本的风险——较低的成本使较高的风险变得可以接受。正是对于谈判何时才能结束未能达成一致意见，导致了罢工的开始。

这一状况简直就是为实践边缘政策而量身定做的。工会可以威胁说要立即终止谈判，继而开始罢工，但罢工对工会成员而言也是代价不菲的。只要仍然存在继续谈判的时间，这么一个可怕的威胁就缺乏可信度。但是，一个较小的威胁还是可信的：随着怒火和紧张情绪逐渐增长，哪怕工会不愿意看到谈判破裂，这样的事情也有可能发生。假如这一前景给管理层造成的困扰大于对工会的困扰，从工会的角度来看这就是一个好的策略。反过来，也有可能成为管理层的一个好的策略。关键在于，边缘政策的策略是双方之间较强的一方——即相对不那么害怕谈判破裂的一方——的武器。

有时候，原有合同到期之后，工人没有举行罢工，而是继续按照原有合同条款工作，工资谈判继续进行。这可能是一个比较好的安排，因为机器和工人都没有闲着，产量也没有减少。不过，这表明，其中一方，通常是工会，正在努力按照自身利益改写原有合同的条款，因此对它而言，这种安排非常不利。那么，管理层为什么应该让步呢？为什么不应该让谈判没完没了地继续下去呢，反正原有合同实际上仍然有效？在这种情况下，威胁仍然在于谈判破裂而举行罢工的可能性。工会走的是边缘政策路线，但现在是在原有合同到期之后进行。常规谈判的时间已经过去。一边按照原有合同规定继续工作，一边继续谈判，这会被大家看做工会示弱的迹象。必须保持举行罢工的某种可能性，才能刺激公司满足工会的要求。一旦发生罢工，要紧的是，什么会使罢工继续下去？达成承诺的关键在于降低这个威胁，使其变得更加可信。边缘政策按照一天之后再来一天的模式将罢工进行下去。永不返回工作岗位的威胁并不可信，假如管理层已经差不多满足工会的要求了，就更没人相信了。不过，多持续一天或一星期就是一个可信的威胁，由此造成的工人的损失比他们将会得到的收益小。假如他们相信他们将会取胜（而且会很快取胜），他们再持续一会儿就是值得的。假如工人们的信念是正确的，那么，管理层就会意识到，屈服的代价比较小，实际上自己也应该马上这么做。于是，工人的威胁就不会造成任何损害。问题是，公司对整个局面的看法可能抱有同样的乐观看法。假如它相信工人马上就会退让，以再失去一天或一星期的利润换取一份对自己更有利的合同就是值得的。这么一来，双方继续处于僵持状态，罢工继续进行。

以罢工形式出现的边缘政策造成代价的方式不同，但效果却是一样的。一旦罢工开始，与其说存在一种遭受大损失的小可能性，不如说存在一种遭受小损失的大可能性，甚至是必然性。随着罢工持续得不到解决，小损失不断变大，从光滑斜坡跌落的可能性也随之增长。证明自己决心的办法是接受更大的风险或者白白看着罢工的损失增长。只有当一方发现另一方确实更强大，它才会考虑退让。力量可能有很多形式：

一方的等待成本可能没那么大，因为它有其他很有价值的选择；
取胜可能非常重要，原因可能是这一方还在跟其他工会进行谈判；
失败的代价可能非常高昂，因此罢工的代价显得较小。

风险与边缘政策会从根本上改变讨价还价的进程。在我们以前提到的各方相继提出建议的谈判的例子中，以后将会发生什么事情的前景促使各方在第一轮就达成协议。边缘政策的一个不可分割的部分就在于有时候大家确实会越过边缘。谈判破裂而举行罢工的情况确实有可能出现。双方可能发自内心地感到遗憾，但这些事情一旦发生就有可能变得难以收拾，且持续时间可能超出人们的意料。

同时就许多事情讨价还价

理论上，许多这样的问题可以简化至等同于金钱总数问题的地步，但存在一个很重要的区别，即各方对这些问题的重视程度可能各不相同。类似这样的区别，为达成一致接受的讨价还价带来了新的可能性。假定一家公司有能力签下一份团体医疗保险合同，而这份保单的条件优于工人自己可能签下的保单，比如一个四口之家每年只要交付1000美元，而不是2000美元。这样的话，工人可能更愿意接受医疗保险，而不是年薪提高1500美元，同样，公司也宁可为工人提供医疗保险而不是额外多支付1500美元工资。

看起来，谈判者应该将所有有关共同利益的问题放在一起进行讨价还价，利用各方对这些问题的重视程度的不同，达成对大家来说都更好的结果。这有时候行得通；比如，以贸易自由化为目标的关税及贸易总协定的更加广泛的谈判，其成效就超过了局限于某个特定领域或产品的谈判。不过，将各种问题混合起来的做法，也使得利用其中一个讨价还价博弈创造可用于另一个讨价还价博弈的威胁成为可能。比如，美国若是威胁日本说，要打破美日军事关系，任凭日本面对俄罗斯入侵的风险而不顾，也许可以在迫使日本打开进口市场的谈判中取得更大的进展。美国当然不会坐视日本遭到入侵，因为那样并不符合它的利益；它那样说不过是一个威胁而已，目的是迫使日本在经济方面做出让步。因此，日本可能坚持要把经济与军事分开谈判。

施比受好？

回想一下讨论的酒店管理层与其职员谈判如何分配旺季收入的讨价还价问题。现在假定不是职员和管理层交替提出建议，而是只有管理层一方可以提出建议，职员只能接受或拒绝。由于管理层具备唯一的提出建议的权力，因此在讨价还价中处于非常强势的有利地位。管理层应该有办法得到尽可能接近总数的一个数目，并在第一天达成协定。为了预测这个结果，我们从结尾开始倒推。在最后一天，继续讨价还价没有意义，因此工会应该愿意接受任何得益为正的金额，比如1美元。而在倒数第二天，工会意识到，今天拒绝对方的建议，明天只能得到1美元，于是它宁可接受今天的2美元。这一论证过程一直到第一天，管理层提议给工会101美元，而工会由于看不出以后可能达成什么更好的方案，表示接受。虽然这个故事夸大了管理层讨价还价的真实力量。推迟谈判，哪怕只推迟一天，就要使管理层付出999美元的代价，而工会的代价只有1美元。工会不仅在乎自己的工资，还会拿自己的工资与管理层的工资相比，从这个角度看，这样极端不平等的分配不可能发生。不过，这并不表示我们必须回到一个平等的分配方案上，而是找出工会可以接受的最小数目，提出来，使工会即使知道管理层的收益可能远远超过自己，也仍然愿意接受它的建议，而不致落得一无所获的下场。

折中妥协或平均分配是解决讨价还价问题的一个常见办法，却并非唯一途径。向前展望、倒后推理给出了一个理由，说明了我们为什么可能会看到不平等的分配。特别地，它暗示了在提出建议的时候，“施比受更好”。

耐性自有回报

比如一家钢铁公司。一场罢工正在进行。如果能够结束罢工，公司每周可以赚取300万美元利润。工会和管理层正就这笔钱的分配讨价还价。谈判每周进行一次，双方交替提出建议。

在很多方面，时间都是金钱。最简单的一点莫过于较早得到的1美元，其价值超过后来得到的1美元，因为较早得到的1美元可以用来投资，并在此后的时间里赚取利息或红利。假如投资回报率是每年5%，那么现在得到的1美元等于明年这时的1.05美元。单纯出于使事情精确化的目的，我们假定工会认为今天的1美元等于一周后的1.01美元，而管理层则认为应该等于1.02美元。换言之，工会的周“利率”是1%，管理层则为2%。管理层迫不及待的程度是工会的两倍。双方耐性上的差别，将对解决它们之间的讨价还价问题产生一个戏剧化的效果：双方的份额与它们的利率成反比，因此工会得到2/3(每周200万美元)，而管理层只得到1/3(每周100万美元)。讨价还价得出的协议会把较大份额归属更加耐心的一方。

第十二章激励

怎样奖赏工作表现?

我们通过一组例子说明设计激励方案的重要思路。假定你自己是加利福尼亚一家高科技公司的老板，打算开发和推出一种新的电脑象棋游戏，名为“巫师1.0”。如果你成功了，你将得到20万美元的销售收入。如果你失败了，你将一无所获。成功或失败完全取决于你的专业棋手兼程序员的工作。她要么全神贯注，全力以赴；要么敷衍了事，得过且过。假如她有高质量的工作表现，那么，你成功的机会将达到80%；假如她只是得过且过，这一比率将降到60%。

象棋程序员只要5万美元就能请到，但他们喜欢做白日梦，这样的工资只能让他们敷衍了事。要得到高质量的工作表现，你不得不支付7万美元。得过且过的工作表现带来20万美元收入的概率只有60%，结果等于平均12万美元；减去5万美元工资，平均利润等于7万美元。假如你请到的是一个具有高质量工作表现的专家，通过同样的计算，得到平均利润等于9万美元(即20万美元×80%-7万美元)。很显然，你用高工资请一个有高质量工作表现的专家比较合算。

不过这里有一个问题：单是观察这位专家每一个工作日的表现，你看不出她究竟是全力以赴了还是在得过且过。既然你看不出高低质量工作表现的区别，怎样才能防止这名专家领取付给高质量工作表现的7万美元工资，却只给你低质量的工作表现呢？即便这个项目失败，人们总是可以怪运气不好。毕竟，就算有了全心全意的投入，这个项目还是有20%的概率遭到失败，这确实只能怪运气不好。

由于你看不出工作表现的质量是高还是低，你不得不将你的回报机制建立在一个你可以看得出区别的东西的基础之上。你要做的是向这名专家提供一份取决于最后结果的报酬：若是成功，报酬数目大一些；若是失败，报酬数目小一些。这一区别，也可以看做成功的奖金，它应该达到这样的水平：让这名专家意识到，向老板提供高质量的工作表现符合她自己的利益。出于这一考虑，奖金数目应该足够大，让这名专家知道，高质量的工作表现将使她多赚2万美元，即收入从5万美元上涨为7万美元。至于成功或失败的时候应该支付多大数目的报酬，仍然是一个问题。答案在于，若是成功，你应该向这名专家支付9万美元，若是失败，她应该向你支付1万美元的罚金。按照这个激励机制，这名程序员的成功奖金为10万美元，这是促使她提供高质量工作表现的最低数目。因此，你向她支付的平均数目为7万美元(即9万美元×80%－1万美元×20%)，其中，9万美元是你支付的数目，80%是成功的概率，而1万美元是她支付的罚金，20%是失败的概率。假如你有办法通过亲自监督看出工作表现的质量高低，这就是你应该确定的数目。这一激励机制非常管用；难以观察到的工作表现的特征对此毫无影响。

不过，这些解决方案可能实现不了，原因可能是向职员收取罚金并不合法，也可能是工人没有足够的资本，用于支付她的那一半价值1万美元的股份。这时候你该怎么办？答案是尽你所能，执行一个最接近罚金/奖金机制或股份平分方案的做法。由于有效的最小奖金为10万美元，因此，若是成功，工人得到10万美元，若是失败，工人一无所获。现在，工人的平均收入是8万美元，你的利润跌到8万美元。若是采取股份平分方案，工人只有自己的劳动力可以出卖，却没有任何资本可以投资在这个项目中。但是，你仍然不得不给她50%的股份，目的是激励她提供高质量的工作表现。于是，你的最佳做法就是卖给她一半的股份，单单换取她的劳动力。不能强制实行罚金制度或工人没有能力投资的事实意味着，从你的角度来看，最后结果不尽如人意——在这个例子里就是10000美元。这时，努力程度的难以观察性就会起作用了。

罚金/奖金机制或股份平分方案的另一个难处在于风险问题。工人一旦参加这个10万美元的博弈，她的激励就会提高。但是，这个重大风险可能无法通过最后结果的统计平均值进行评估。遇到这种情况，工人因同时提供高质量工作表现和承担风险，应该得到补偿。风险越大，补偿越高。这一额外补偿是一家公司由于不能监控工人工作表现而产生的另一项额外成本。通常，最好的解决方案就是达成妥协；向工人提供低于理想激励数目的激励，从而降低风险，同时接受由此导致的低于理想质量水平的工作表现。

在其他例子中，你可能遇到别的反映工作表现质量高低的指标，在你设计激励机制的时候，你可以运用这些指标，而且也应该这么做。也许最有趣也最常见的情况是同时存在几个项目。虽然成功只是工作表现质量高低的一个并不确切的统计指标，却可以由于能对其做更多的观察而变得更加精确。有两个办法做到这一点。假如同一名专家为你的多个项目工作，你可以建立一个档案，记录她的成败情况。你若是看到反复出现的失败，你就能更有信心地把它归咎于工作表现质量低劣，而不是单纯的运气不好。你的推论的精确度提高了，你就能设计出一个更好的激励机制。第二种可能出现的情况是多名专家为你的一系列相关项目工作，各个项目的成败之间存在某种关联。假如一名专家失败了，而她周围的其他专家却取得了进展，你就能更自信地判断她在开小差，而不是运气不好。因此，建立在相对表现基础之上的回报，换言之，奖励，能产生合适的激励。

怎样组织一个合作项目?

在原有合作关系中，加上强制性的惩罚条款，以打消事后反悔的念头。本章主要讲述怎样设计这样的条款。人际合作关系的问题与商业合作关系如出一辙。假定有一对双职工夫妻，双方都不喜欢做饭，却又负担不了每周外出就餐超过一次的开销。他们出于直觉或经过协商决定大家平等分担家务活，每人每周做饭三天。但是，打个比方，假如妻子知道，丈夫不会因为她把自己承担的义务减为两天就跟她分手。她就有一种激励，希望发掘额外的工作，好使自己在一周中总有几天不得不在办公室多呆一小时，这么一来，她无论是如何也来不及回家做饭了，哪怕当天确实轮到她做饭。反过来，丈夫应该向前展望，预计到这个结果，然后尝试从一开始就使这个交易有助于降低妻子以后偷懒的激励。

商业合作关系情形的基本特征是什么？首先，这类情形涉及需要两个或两个以上个人或公司同时参与的项目。各方必须事先投入一笔资金，若是合作关系终止，他们就不能收回这笔资金，否则对方退出合作关系也就不会造成任何威胁。其次，在重开谈判的前提条件上一定存在某种不确定性，否则，只要一个就任何违约处以高昂罚金的简单条款就能达到这个目的。

假定开发一个电脑系统的工作包括两个部分，即开发一对相互兼容的硬件和软件组成部分。两家分别擅长上述其中一个领域的公司正在考虑这个项目。初期开发需要分别在硬件部分和软件部分投入220万美元和110万美元。初期开发以后，还将发生完成这一开发项目必需的其他成本。而在此时，潜在的合作伙伴们只知道可能产生的成本有低、中、高三种档次的区别。假定在硬件部分，低、中、高三种档次的成本分别为1800万美元、2400万美元和3000万美元，软件部分则为900万美元、1200万美元和1500万美元。完成的电脑系统预计可以创造3900万美元的经营利润。

合同

由于硬件公司承担的成本恰好是软件公司的两倍，因此，答案看上去应该很简单。就让它们两家各自承担自己那部分开发成本好了。假如这个项目继续下去，就要首先补偿两家的开发成本，然后按照二比一的比例分配余下的利润，硬件公司得二，软件公司得一。

不幸的是这根本行不通。假定硬件公司的初期开发显示其开发成本将会降低，那么，如果它说谎，宣称自己的成本属于中的水平，就能占便宜。不管这家公司有没有说谎，该项目总会进行。不过，夸大成本将使这家公司得到额外的600万美元补偿，而分配利润的时候只会少得400万美元。无论软件公司提交怎样的成本数字，硬件公司都会多得200万美元。因此，对于硬件公司，在成本位于低水平的时候宣称成本达到中水平就是一种优势策略。软件公司面临同样的诱惑；它想把成本数字夸大为高水平。不过，由于双方都在说谎，开发阶段永远不会出现经营利润，一旦双方在开发阶段就知道这个事实，它们根本不会将这个项目进行下去。

现在我们设想一个替代方案。干脆以二(给硬件公司)比一(给软件公司)的比例分配经营利润，由两家公司各自承担自己的开发成本。这样一来就不会存在抬高成本的激励。不过，我们却失去了做出正确的取消计划的决策的步骤。软件公司得到1300万美元的经营利润。若它的成本达到高水平(1500万美元)，它当然希望取消这个计划，哪怕硬件公司的成本属于低水平，而继续下去可能给大家带来收益。而另一方面，假如软件公司的成本位于中水平(1200万美元)，它一定想将计划继续下去，哪怕硬件公司的成本位于高水平，而取消这个计划的决定可能对大家更有好处。这份合同应该允许在一方提出请求的时候取消(一方申请即判离婚)，还是应该在双方同时提出请求的时候才能取消(双方同意才能离婚)？无论采纳哪一种规则，在有些情况下都会产生违背人们意愿的结果。怎样才能将有效的启动决策与真实报告己方的成本或收入信息的激励结合起来，这是设计一份理想的合同面临的两难问题。

按成本付账

我们先将重点放在硬件公司的激励之上。最简单的解决方案是，假如硬件公司决定将开发项目继续下去，它必须补偿软件公司的成本，然后保有余下的全部利润。无论双方的成本总和是不是低于利润目标，硬件公司都将决定继续下去，它的收入为总收入减去自身开发成本，再减去对软件公司的补偿之后的数目。这一激励机制能给予硬件公司做出有效决策的激励。

硬件公司怎样才能知道软件公司的成本呢？双方可以同时宣布成本数字，并且，只在这两个数字之和低于利润目标的前提下，双方才同意将这个项目继续下去。由于硬件公司保有补偿软件公司开发成本之后的全部利润，只要余下的利润高于它的真实成本，它就希望继续下去。确保得到这一结果的唯一做法是，硬件公司宣布真实的成本数字。假如软件公司夸大其成本，那么，继续下去未必总是一个正确决策。不过，无论软件公司采取什么策略，硬件公司仍然愿意宣布真实的成本数字：说实话是硬件公司的优势策略。

为充分理解这一点，我们逐一考虑以下各种情况。硬件公司知道，软件公司可能宣布高、中、低水平的三个数字之一。假如软件公司宣布的数字是900万美元(低水平)，那么，无论硬件公司宣布什么样的成本数字，这个项目都要继续下去，而硬件公司的收入将为3000万美元(即3900万美元－900万美元)，足够补偿一切成本。接下来，假定软件公司说的是1200万美元。假如硬件公司的真实成本是1800万美元(低水平)或2400万美元(中水平)，它说实话就能使这个项目继续下去，得到2700万美元的收入，仍然足够补偿1800万美元或2400万美元的真实成本。将成本夸大为高水平只能导致项目取消，等于错过一个有利可图的机会。而另一方面，假如硬件公司的成本真的达到3000万美元(高水平)，而它瞒报为低或中水平，结果，项目继续下去，而硬件公司最后所得为2700万美元，等于净亏300万美元。概括而言，假如项目继续下去，夸大成本对利润毫无影响，但这么做却可以导致项目取消，从而失去一个有利可图的机会。假如项目取消，瞒报成本对利润毫无影响，但这么做却可能导致做出继续下去的决策，而这实际上意味着亏损。因此，说实话是硬件公司的优势策略。这一激励机制改变了硬件公司的策略环境，使其愿意奉行“既不夸大也不瞒报”的准则。

一个不同的观点给这个激励机制带来了新的有用的思考。当硬件公司争取得到“继续下去”的决策时，它会要求软件公司承担部分成本。这种加在对方身上的成本称为“外部性”或者“界外效益”，激励机制的目的在于促使人们将自己加在对方身上的成本考虑在内。硬件公司以得到的经营利润减去软件公司成本余下的数目作为收入，就是一个很好的例子。如果这个项目继续下去，硬件公司的总现金流等于经营利润减去软件公司的成本，再减去它自己的成本。这么一来，硬件公司会同样认真地关注降低两家公司成本的工作。换言之，它实际上是从符合双方共同利益的角度行事，或者说将界外效益内部化。

同样的技巧可以用来解决软件公司的激励问题，假如情况完全相反，即软件公司得到总利润减去它自己的成本，再减去硬件公司宣称的成本数目之后余下的部分。如前所述，只要利润超过两家宣布的成本的总和，这个项目就会继续下去。一个同样的证明过程显示，宣布真实的成本数字是软件公司的优势策略。

不过，这还没完。我们还得将两个激励机制结合起来，使它们可以同时起作用。否则只能是一方说实话，却不能保证产生有效的结果。同时运行两个激励机制的问题在于，无论哪一种决定继续下去的情况，其总支出总是超过总收入！所有可以用来分配的东西就是经营利润。但这个由两个激励机制结合形成的综合激励机制却计算了两次经营利润，然后减去两家公司的成本。不足的部分等于经营利润减去两家的成本，而这个数字只要项目继续下去便是正值。解决这个问题的一个办法是让两家公司事先投入一笔合适数目的款项，用于弥补不足的部分。假如两家公司事先投入相当于预计不足部分的统计平均值的款项，那么，它们将在某些情况下有盈余，而在另一些情况下出现亏损。在我们提出的例子中，事先投入的数目应为400万美元。

不过，我们还有可能做得更好。我们可以设计一份合同，使得(1)两家公司都有报告真实成本的激励，(2)这份合同总能确保有效的继续下去或取消的决策，(3)合同能在个案分析基础上做到不盈不亏，而不仅仅是做到平均值不盈不亏。有效合同背后的原理，是使公司将它们通过自身行动加在对方身上的成本考虑在内。我们刚才已经看到，假如每家公司都要支付对方的成本，它们就有一种激励，要宣布真实成本数字以及做出有效的继续下去的决策。不过，这又引出预算平衡的一个问题。因此，各方与其向对方支付实际成本，倒不如支付通过自身行动加在对方身上的成本的预计值或统计平均值。假如一方宣布了一个低水平的成本，这就增加了项目继续下去的机会，相应地也增加了对方公司不得不承担某些生产成本的可能性。为了促使各方将自己加到对方身上的成本考虑在内，各方的收入应为这个项目经营利润的统计平均值减去如果项目继续下去对方公司不得不承担的成本的平均值而得到的数目。假如一家公司夸大自己的成本，它将不得不经常冒项目取消而使自己得到较少收入的风险，假如它瞒报自己的成本，则会产生一个更高的“界外效益”支出，用于补偿预计可能加在对方身上的成本。两个例子可以说明这一点。假如硬件公司宣布它的成本为低水平(1800万美元)，那么，无论软件公司的成本如何，是900万美元、1200万美元还是1500万美元(三个数字出现的概率都是1/3)，这个项目都会继续下去。这时，软件公司的成本的统计平均值为1200万美元。这是在计算硬件公司所得的时候，从3900万美元经营利润当中抽取的那一部分。假如硬件公司宣布它的成本为高水平(3000万美元)，那么，这个项目只会在软件公司公布低水平成本(900万美元)的时候继续下去，而这一条件出现的概率为1/3。因此，硬件公司将得到3900万美元减900万美元之后的1/3，即1000万美元。

如果一方在终止合作关系的时候，必须承担对方的全部支出，那么这一方就会得到正确的激励，以维持合作关系。有时候合作关系可能解除，但一方的收获并非建立在另一方的损失的基础之上。支付你加在对方身上的成本的理念，在很多情况下都非常有用。它甚至有助于我们理解拍卖当中的出价策略。

招标、拍卖的策略

许多制造或供应合同，尤其是来自政府方面的合同，有时也有私营公司的合同，是通过密封投标的招标决定判给哪一家。每一家公司提交一个密封的信封，里面开出它愿意接受这项工程的价码。然后，所有标书放在一起进行比较，开价最低的公司胜出，同时得到它所要求的价码。假定现在有这么一份合同，比方说是建设一段高速公路，而你是一个投标者。你的成本(包括正常情况下你希望投资能够获得的回报)是1000万美元。你并不知道你的竞争者的成本，可能甚至不晓得他们究竟都是些什么人。不过，你有理由相信，他们的成本应该介于500万美元到1500万美元之间。他们当中，最佳投标者的开价落在两个极端之间任意一个数目的概率均等，也就是说，以这一范围为横轴，以每百万美元为一点，那么，落在任意一点的概率都是1/10。这时，你应该怎样开价？

你永远不会开出一个低于你的成本的价码。比如，假定你开价900万美元。如果你没能胜出，当然没问题；但若是你赢了，你得到的价码将低于你的成本。那么，开出一个高于你的成本的价码又如何？假定所有投标者都会诚实开价，我们看看如果你开价1100万美元，会发生什么事情。你必须分别考虑三种可能性。从概率角度看，十次机会里面，有五次可能遇到一些投标者开出低于1000万美元的价码，这时，你抬高开价的做法已经无法左右最后的判决；十次机会里面，有四次可能遇到最厉害的对手也开出超过1100万美元的价码，这样你可能通过开价1000万美元或1100万美元胜出，不过，较高的开价能使你多得100万美元的利润；十次机会里面，有一次可能遇到最厉害的对手开出介于1000万美元和1100万美元的价码，这时，你抬高开价的做法将使你付出痛失合同的代价。不过，若最后定价是1000万美元，这个数目只够弥补你的成本，那么这份合同对于你则可有可无。现在将上述三种情况放在一起，你可以看到，开出一个抬高的价码对你而言是一个好的策略；用博弈论的术语来说，这个策略优于诚实开价。其他参与者其实也在打同样的主意，到了最后，所有开价都被抬高了。

如果开价等于真实成本，社会就能对这段公路做出一个精确的成本效益分析，而建设这段路的决策也就有经济效益。有没有其他出价机制可以消除夸大开价的策略激励呢？有的。一个简单的机制就是将合同判给开价最低者，但付开价第二低者的价码。我们看看这一机制是怎样起作用的：假定你的成本还是1000万美元，而你打算开出1100万美元的价码。如前所述，有三种情况需要考虑。假如最厉害的对手开价低于1000万美元，你抬高开价的做法已经无法左右最后的判决。假如最厉害的对手开价也超过1100万美元，你将赢得这份合同，不过这回你将得到与最厉害的对手开价相等的价码，因此，抬高开价的做法并没有为你带来任何好处。假如最厉害的对手开价介于1000万美元和1100万美元之间，你的抬高开价的策略将使你痛失合同，而你若是说实话，将至少得到一点利润，确切地说就是最厉害的对手开出的价码超过1000万美元的那部分。概括起来，抬高你的成本在两种情况下都不会给你带来任何好处。因此，你有一个优势策略，即开出一个数目等于你的成本的价码。

我们可以从另一个角度考察这一点，从而给这个机制带来某种新的有价值的认识。当你将自己的开价从1000万美元抬高到1100万美元的时候，你是在将一个成本加在社会身上，确切地说，是在创造将合同判给一家成本比你更高的公司的机会。这里和前面提到的一样，由一方加在他人身上的成本被称为界外效益。一个好的激励机制必须促使你将你的行动的真实的社会成本考虑在内，包括你加在别人身上的一切界外效益。为达到这个目的，可以向你收取这些成本，或由于你避免了这些成本的发生而给予你的奖励。回到目前的例子上，第二种方法是有效的。由于你没有抬高开价，你就使社会避免了实施一个不必要的、代价高昂的项目的风险，由此你将得到回报，即判给你的合同价码将等于较高的开价。

对于这个案例，有效的解决方案是让开价最低的公司得到合同。这么一来，开价第二低的公司也就不会产生成本，而这笔省下的费用是一个正的界外效益。只要胜出的投标者能由这笔界外效益得到补偿，它就有说实话的激励，从而有效的决定也能顺利做出。不过，要能从投标者那里听到实话并非没有代价。美国交通部就不得不向开价最低者支付超过它自身成本的价码，确切地说就是次低开价。

我们通过这一类型的招标拍卖不仅可以购买物品，也可以出售物品。每人用密封的信封提交自己开出的价码，投标物品将售予开价最高者，但价码等于次高开价。这一方法是由哥伦比亚大学经济学家威廉·维克利发明的，称为“维克利拍卖”或“集邮家拍卖”(因为集邮杂志用这一方法以邮递途径拍卖邮票)。这里，大家还是应该开出一个真实估价。抬高开价可能使你以高于实际价值的价码赢得这场拍卖，另一方面，压低开价并不能为你省钱，反而有可能使你出局，虽然你本来非常愿意支付次高开价。实际上，这个只有一个步骤的方法可以产生与一场传统英式招标拍卖完全相同的结果。在英式拍卖中，所有投标者聚集在同一个房间，拍卖官依次叫出越来越高的价码。出价过程一直持续到只剩下一个投标者为止——一次，两次，成交！倒数第二个投标者应该只在价码超出自己估价的时候退出。于是，对该项物品估价最高者将如愿以偿，而他只需支付次高开价。不过，这其实就是“维克利拍卖”的结果。

在政府为一个道路工程征集标书的案例中，将合同判给出价最低者而非出价次低者的做法，表面看来似乎具有节约预算的优势，但只要我们明白投标者有怎样的对策，确切地说就是抬高他们的出价，这一优势也就荡然无存。开价最低者得到合同，同时得到他开出的价钱，但这个价码早已被抬高了。若是对这一问题进行一个全面的数学分析，结果将显示，这个常规做法带来的预算影响，恰好等同于以第二开价支付胜方的做法的影响。这么一来，我们讨论的这一机制与常规做法相比毫无优胜之处。造成这一等同状况的直觉理由在于，两种类型的拍卖永远应该得到同一个有效率的结果；成本最低者永远应该胜出。不过，只有在人们将自己加在他人身上的界外效益考虑在内的时候，效率才会出现。因此，在赢得招标拍卖的条件下，一家公司的最优化开价应该是次佳竞争者的预期成本，胜出的公司以预期的或平均的界外效益价码投标，而不是以实际界外效益开价。

案例分析

别人的信封总是更诱人

赌博必然存在的一个事实是一人所得意味着另一人所失。因此，在参加一场赌博之前，非常重要的一点是从另一方的角度对这场赌博进行评估。理由在于，假如他们愿意参加这场赌博，他们一定认为自己可以取胜，这就意味着他们一定认为你会输。总有一个人说错了，不过，这个人究竟是谁呢？本案例分析将探讨一个看起来对双方都有利的赌博。当然实际情况不可能对双方都有利，可是，问题究竟出在哪呢？

现在有两个信封，每一个都装着一定数量的钱；具体数目可能是5美元、10美元、20美元、40美元、80美元或160美元，而且大家也都知道这一点。同时，我们还知道，一个信封装的钱恰好是另一个信封的两倍。我们把两个信封打乱次序，一个交给阿里，一个交给巴巴。两个信封打开之后(但里面的数目只有打开信封的人知道)，阿里和巴巴得到一个交换信封的机会。假如双方都想交换，我们就让他们交换。假定巴巴打开他的信封，发现里面装了20美元，他会这么推理：阿里得到10美元和40美元的概率是一样的，因此假如我交换的话，预期回报等于25美元（(10+40)/2），大于20美元，对于数目这么小的赌博，这个风险无关紧要，所以，交换信封符合自己的利益。通过同样的证明可知，阿里也想交换信封，无论她打开信封发现里面装的是10美元(她估计他要么得到5美元，要么得到20美元，平均值为12.50美元)还是40美元(她估计他要么得到20美元，要么得到80美元，平均值为50美元)。这里出了问题。双方交换信封不可能使他们的结果都有所改善，因为用来分配的钱不可能交换一下就变多了。推理过程在哪出了错呢？阿里和巴巴是否都应该提出交换呢？阿里或巴巴是否有一方应该提出交换呢？

假如阿里和巴巴都是理性的，而且估计对方也是这样，那就永远不会发生交换信封的事情。这一推理过程的问题在于它假设对方交换信封的意愿不会泄露任何信息。我们通过进一步考察一方对另一方思维过程的看法，就能解决这个问题。首先，我们从阿里的角度思考巴巴的思维过程。然后，我们从巴巴的角度想象阿里可能怎样看待他。最后，我们回到阿里的角度，考察她怎样看待巴巴怎样看待阿里对自己的看法。其实，这听上去比实际情况复杂多了。可是从这个例子看，每一步都不难理解。假定阿里打开自己的信封，发现里面有160美元。在这种情况下，她知道她得到的数目比较大，也就不愿加入交换。既然阿里在她得到160美元的时候不愿交换，巴巴应该在他得到80美元的时候拒绝交换，因为阿里唯一愿意跟他交换的前提是阿里得到40美元，但若是这种情况，巴巴一定更想保住自己原来得到的80美元。不过，如果巴巴在他得到80美元的时候不愿交换，那么阿里就不该在她得到40美元的时候交换信封，因为交换只会在巴巴得到20美元的前提下发生。现在我们已经到达上面提出问题时的情况。如果阿里在她得到40美元的时候不肯交换，那么，当巴巴发现自己的信封里有20美元的时候，交换信封也不会有任何好处；他一定不肯用自己的20美元交换对方的10美元。唯一一个愿意交换的人，一定是那个发现信封里只有5美元的人，不过，当然了，这时候对方一定不肯跟他交换。

末位应该变成首位

美国政府遇到一个大问题，即如何激励数以百万计到了法定年龄的青少年去注册，等待政府征召入伍。法不责众。由于平民百姓大规模违反征兵法，对违法者进行处罚成了不可能的任务。不过，政府还是有一个很有利的条件：规矩是由它制定的。要想考察先行的好处，不妨想象人民只允许政府惩罚一个没有注册的人。政府怎样才能利用这唯一一个威胁促使大家都去注册呢？

政府可以宣布它要按照字母顺序追究违法者。但，真正有威胁的方式是禁止预先宣布任何顺序。如果一场博弈的参与者按照某种顺序排列，通常就有可能预计到排在一头的人会怎么做。这一信息会影响到下一个人，接下去影响到第三个人，如此沿着整个行列一直影响下去。按照字母顺序追究违法者有点极端化了。等我们数到朱可夫们的时候，一定有人没有注册，而且已经受到惩罚。于是朱可夫们就不必担心了。在人数众多的情况下，我们可以预计到会有一个很小数目的人群出差错。关键一点在于可以实施惩罚的数目，完全不必接近需要激励的人群的数目。将1000名示威者关进监狱的能力(和意愿)可以对数以百万计可能示威的人群产生阻吓作用。

三方对决

话说有三个仇家，分别叫做拉里、莫和卷毛，他们决定来一场三方对决。总共有两个回合：第一回合，每人得到一次射击机会，射击次序分别为拉里、莫和卷毛；第一回合过后，幸存者得到第二次射击机会，射击次序还是拉里、莫和卷毛。对于每一个参与对决的人，最佳结果都是成为唯一幸存者；次佳结果则是成为两个幸存者之一；排在第三位的结果，是无人死亡；最差的结果当然是自己被对方打死。拉里的枪法很糟糕，瞄准10次只有3次能够打中目标。莫的水平高一点，精确度有80%。卷毛是神枪手，百发百中。那么，拉里在第一回合的最优策略应该是什么？在这个问题里，谁有最大的机会幸存下来？

虽然倒后推理是解决这个问题的一个稳妥途径，但我们可以运用一点向前展望的论证，向前跳一步。我们从依次讨论拉里的每一个选择开始。假如拉里打中莫，会发生什么事情？假如拉里打中卷毛，又会怎样？假如拉里向莫开枪并打中对方，他等于签下了自己的死亡保证书，因为接下来轮到卷毛，而他百发百中。卷毛不可能放弃向拉里开枪的机会，因为开枪将使他得到自己的最佳结果。拉里向莫开枪似乎不是一个非常吸引人的选择。假如拉里向卷毛开枪并打中对方，接下来轮到莫。莫会向拉里开枪。于是，假如拉里打中卷毛，他的幸存概率仍不足20%(等于莫失手的概率)。到目前为止，上述选择没有一个显得很有吸引力。实际上，拉里的最佳策略是向空中开枪！若是这样，莫就会向卷毛开枪，假如他没打中，卷毛可以向莫开枪，并把他打死。于是进入第二轮，又轮到拉里开枪了。由于只剩下一个对手，他至少有30%的概率保住性命，因为这是他打中剩下这个对手的概率。

这个案例的意义在于，弱者可能通过放弃自己的第一个成功机会取得更好的结果。如果你的幸存机会不仅取决于你自己的本事，还要看你威胁到的人。一个没有威胁到任何人的弱者，可能由于较强的对手相互残杀而幸存下来。卷毛虽然是最厉害的神枪手，他的幸存概率却最低，只有14%。莫幸存的概率是56%。拉里的最佳策略使他能以30%的精确度换取41.2%的幸存概率。

弄巧成拙的防鲨网

近年来，企业采纳了许多新鲜而富有创意的做法，通常称为防鲨网，用于阻止外界投资者吞并自己的企业。现在有一个成为他人目标的公司叫做风笛手的腌胡椒。虽然该公司已经公开上市，却还是保留了过去的家族控制模式，董事局的5名成员听命于创办人的5名孙子孙女。创办人早就意识到他的孙子孙女之间会有冲突，也预见到外来者的威胁。为了防止家族内讧和外来进攻，他首先要求董事局选举必须错开。这意味着，哪怕你得到该公司100%的股份，你也不能一股脑儿取代整个董事局，相反，你只能取代那些任期即将届满的董事。5名董事各有5年任期，但届满时间各不相同。外来者最多只能指望一年夺得一个席位。从表面上看，你需要3年时间才能夺得多数地位，从而控制这家公司。创办人担心，假如一个充满敌意的对手夺取了全部股份，他的这个任期错开的想法可能会被篡改。因此，有必要附加一个条款，规定董事局的选举过程只能由董事局本身修改。任何一个董事局成员都可以提交一项建议，无须得到另一个成员的支持。但接下来就是一个大难题。提议的人必须投他自己的提议一票。投票必须以顺时针次序沿着董事局会议室的圆桌进行。一项提议必须获得董事局至少50%的选票才能通过(缺席者按反对票计算)。在董事局只有5名成员的前提下，这就意味着至少得到3票才能通过。要命的是，任何人若是提交一项提议而未获通过，不管这项提议说的是修改董事局架构还是选举方式，他都将失去自己的董事席位和股份。他的股份将在其他董事之间平均分配。同时，任何一个向这项提议投了赞成票的董事也会失去他的董事席位和股份。

有那么一段时间，这个条款看来非常管用，成功地将敌意收购者排除在外。可是现在，海岸公司的海贝壳先生通过一个敌意收购举动，买下了该公司51%的股份。海贝壳先生在年度选举里投了自己一票，顺利成为董事。不过，乍看上去，董事局失去控制权的威胁并非迫在眉睫，毕竟海贝壳先生是以一敌四。在第一次董事局会议上，海贝壳先生提议大幅修改董事资格的规定。这是董事局首次就这样一项提议进行表决。海贝壳先生的提议不仅得到通过，更令人感到不可思议的是，这项提议竟然是全票通过！结果，海贝壳先生随即取代了整个董事局。原来的董事在得到一项称为“降落伞”的微薄补偿(总比什么也没有强！)后，就被扫地出门。他是怎么做到这一点的呢？倒后推理正是关键。

海贝壳先生的修改提议包含下列三种情况：

假如这项提议全票通过，海贝壳先生可以选择一个全新的董事局。每一位被取代的董事将得到一份小小的补偿。
假如这项提议以4比1通过，投反对票的董事就要滚蛋，不会得到任何补偿。
假如这项提议以3比2通过，海贝壳先生就会把他在风笛手的腌胡椒公司的51%的股份平分给另外两名投赞成票的董事；投反对票的董事就要滚蛋，不会得到任何补偿。

到了这里，倒后推理为故事画上了句号。假定一路投票下来，双方打成平手，最后一名投票者面对2比2的平局。假如他投赞成票，提议就会通过，他本人得到该公司25.5%的股份。假如提议遭到否决，海贝壳先生的财产(以及另外一名投赞成票的董事的股份)就会在另外三名董事之间平分，他本人得到21.1%(即(51%+12.25%)/3)。他当然会投赞成票。大家都可以通过倒后推理，预计到假如出现2比2平局的情况，最后一票投下之后海贝壳先生就会取胜。现在来看第四人的两难处境。轮到他投票的时候，可能出现以下三种情况之一： (1)只有1票赞成(海贝壳先生投的)；(2)2票赞成；(3)3票赞成。假如有3票赞成，提议实际上已经通过了。第四人当然宁可得到一些好处也不愿一无所获，因此他会投赞成票。假如有2票赞成，他可以预计到哪怕自己投反对票，最后一个人也会投赞成票。第四人无法阻止通过这个提议。因此，更好的选择还是投靠即将取胜的一方，所以他会投赞成票。最后，假如只有1票赞成，他愿意投赞成票换取2比2的平局。因为他可以自信地预计到最后一个人会投赞成票，并且他们两人将合作得非常漂亮。这么一来，最早投票的两名董事就陷入了困境。他们可以预计到，哪怕他们都投反对票，最后两人还是会跟他们作对，这项提议还是会获得通过。既然他们无法阻止这项提议通过，还是随大流换取某些补偿比较好。

贵人行为理应高尚

欧佩克的一个重要特点是其成员的生产能力各不相同。沙特阿拉伯的生产能力远远超出其他成员。同属一个卡特尔的大成员和小成员，它们的作弊激励是不是一样大？为了简化这个问题，我们只看一个小成员，即科威特。假定在合作的情况下，科威特应该每天生产100万桶石油，沙特阿拉伯则生产400万桶。对于它们两家，作弊意味着每天多生产100万桶。换言之，科威特有两种选择，分别是100万桶和200万桶；沙特阿拉伯则为400万桶和500万桶。基于双方的不同选择，投入市场的总产量可能是500万桶、600万桶或700万桶。假定相应的边际利润(每桶价格减去每桶生产成本)分别为16美元、12美元和8美元。科威特有一个优势策略：作弊，每天生产200万桶。沙特阿拉伯也有一个优势策略：遵守合作协议，每天生产400万桶。沙特阿拉伯一定遵守协议，哪怕科威特作弊也一样。囚徒困境就此破解。为什么会这样？

沙特阿拉伯出于纯粹的自利心理，有一个合作的激励。假如它生产一个较低数量，则市场价格攀升，欧佩克全体成员的边际利润上扬。假如它的产量只占欧佩克总产量一个很小的份额，它自然不会发现，原来向整个卡特尔提供这种“公共服务”对自己也有好处。不过，假如它的份额很大，那么，上扬的边际利润会有很大一部分落在它手里，因此，牺牲一些产量也是值得的。这个例子描述了走出囚徒困境的另一个途径：找出一个大慈善家，让它遵守合作协议，并容忍其他人作弊。

同样的事情见之于许多联盟。在许多国家，一个大政党和一个或多个小政党必须组成一个联合政府。大政党一般愿意扮演负责合作的一方，委曲求全，确保联盟不会瓦解，而小政党则坚持它们自己的特殊要求，而选择通常可能偏向极端的道路。以色列联合政府的小宗教团体的影响就是一个很好的例子。北约内部有另一个例子：美国承担了防务开支一个不恰当比例的份额，大大便宜了西欧和日本。美国经济学家曼库尔·奥尔森将这一现象非常简洁地称为“小国对大国的剥削”。

李尔王的难题

假定父母希望孩子们每周探望一次，电话问候两次。为了给孩子们一个正确的激励，父母威胁说谁若是达不到这个标准，就会失去继承权。他们的财产将在所有符合要求的孩子们之间平均分配。(除了可鼓励探望，这一规定还有一个好处，即可以避免鼓动孩子们为了争取较大份额的遗产而频繁探望，导致父母失去私人空间。) 孩子们意识到父母不愿意剥夺所有孩子的继承权。于是他们串通一气，一起减少探望的次数，最后降到一次也不去。这对父母现在请你帮忙修改他们的遗嘱。只要有遗嘱，就有办法让它发挥作用。不过，怎样才能做到呢？一个前提是，这对父母不许你剥夺所有孩子的继承权。

和原先的版本一样，任何一个探望次数不能达标的孩子都将失去继承权。问题在于，假如他们的探望次数统统低于标准，怎么办？若是出现这种情况，不妨将所有财产都分给探望次数最多的孩子。这么做可以打破孩子们之间结成的减少探望次数的卡特尔。我们使这些孩子陷入了一个多人囚徒困境。每个孩子只要多打一个电话就有可能使自己应得的财产份额从平均值跃升为100%。唯一的出路就是遵照父母的心愿行事。(很显然，这一策略在只有一个孩子的情况下会失效。对于只有一个孩子的夫妇，没有什么好的解决方案。这真是抱歉得很。)

错错得对

父母经常遇到一个难题，就是怎样惩罚做坏事的孩子。孩子们总有一种奇怪的念头，并且不相信父母真能说到做到，实施惩罚。他们认为惩罚对父母的伤害可能就跟对自己的伤害一样大(尽管受伤的原因并不相同)。父母对待这一矛盾的标准对策是强调惩罚完全是为孩子着想。父母说了要惩罚做坏事的孩子之后，怎样才能更好地使这一威胁变得可信呢？

若是一对父母加一个孩子的家庭，我们面对的是一个三人博弈。团队合作有助于父母做出一个可信的威胁，要惩罚做坏事的孩子。假定孩子当真做了坏事，按照计划，父亲应该实施惩罚。如果儿子以为，只要指出父亲这一行动的“不合理性”，即双方都将受到伤害，就能逃脱惩罚，父亲可以这么回答：假如他真有选择余地，他当然不愿意惩罚自己的儿子；但是，假如他没能实施惩罚，他就破坏了他和妻子达成的一个协议，而破坏这个协议产生的代价将超过惩罚孩子带来的代价。由此，惩罚的威胁就变得可信了。

即便单亲家庭也能玩这个博弈，只不过论证起来比较费事，因为惩罚的协议必须在父亲(或母亲)与孩子之间达成。和上面一样，假定孩子当真做了坏事，按照计划，父亲应该实施惩罚。如果儿子以为，只要指出父亲这一行动的“不合理性”，即双方都将受到伤害，就能逃脱惩罚，父亲可以这么回答：假如他真有选择余地，他当然不愿意惩罚自己的儿子；但是，假如他没能实施惩罚，这就等于他失职了，而他要为失职遭到惩罚。因此，他惩罚自己的儿子的目的在于避免自己遭到惩罚。不过，谁来惩罚他呢？答案是他的儿子！儿子会说，如果父亲原谅他，他也会原谅父亲，不会因为父亲没有惩罚自己而惩罚他。父亲会说，假如儿子不能惩罚他的过分宽容的做法，这就等于儿子在一天之内第二次做出了应受惩罚的行为！就这样，在你来我往之间，父子相互监督，都保持了诚实。这听上去可能有点牵强，却并不比大多数用于支持惩罚孩子坏行为的论证过程来得简单。

给市长发一枚“大奖章”

1987年，纽约市长埃德·科克成功地增加了曼哈顿的持照出租车的数目。此前50年，曼哈顿人口增加了300万，但出租车只多了100辆。出租车短缺的一个迹象是，1987年，合法经营一辆出租车的权利(俗称“大奖章”)在公开市场标价125000美元。与此同时，出租车按每天两班、每班12小时出租，每班价格约为60美元(合每年约45000美元)。假如市政府拍卖100个新的大奖章，就能轻松地赚到1250万美元。问题是，所有这些新的大奖章获得者就会担心，市政府已经发现了一个好得难以置信的发财机会。既然如此，为什么明年不再拍卖100个新的大奖章呢？如果市政府不能承诺限制大奖章的颁发数量，以保证大奖章不会变得一文不值，那么第一个后果就是再也不会有人愿意为大奖章出高价了。科克市长想知道怎样才能同时增加出租车的数目和库房收入。他正在寻找办法，使自己做出一个承诺，并以此约束自己(以及以后的政府)不要再源源不断地印制新的许可证，防止旧的大奖章大大贬值。当时，出租车与轿车委员会正左右为难，但谁也不会单单听信一个政客的话。你有什么建议？

诀窍在于出租而非出售大奖章。这么一来，没人要为以后的价值付钱。市长就会有一种限制大奖章出租数量的激励，因为假如他出租太多，总租金就会下降，并且很有可能随着大奖章变得一文不值而一直降到零。注意，这实际上就是一步一步做出承诺的应用实例。这里的步骤不是大奖章的数目，而是大奖章的有效期。人们愿意在一周或一年之内相信这个市长，而新规定的通过是需要一段时间的。最具风险的是大奖章一年的价值。对市长而言与其将今年的大奖章、明年的大奖章以及未来的大奖章合并为一枚永久性的大奖章，然后再出售，还不如一次只出售一枚大奖章，从而恢复自己的可信度。要做到这一点，一个简单的办法就是出租，而不是出售。

大洋两岸的武装

在美国，许多私有房主都拥有自卫用的枪，而在英国，几乎没人有枪。文化差异无疑提供了一个解释。策略行动的可能性则提供了另外一个解释。在这两个国家，大多数私有房主都喜欢住在一个非武装社区。但如果他们确实有理由害怕会遇到武装歹徒，他们都愿意买一支枪。许多歹徒喜欢带上一支枪，作为他们这个行业的一个作业工具。

假如不存在任何策略行动，我们应该把这个案例当做一个同时行动的博弈，运用第3章学习的技巧进行分析。首先我们应寻找优势策略。由于歹徒在第二列的排名永远高于第一列的对应数字，我们可以说歹徒有一个优势策略：不管私有房主有没有枪，他们都愿意带上一支枪。私有房主却没有优势策略；他们愿意区别对待。如果歹徒没带枪，那他们也就没必要配枪自卫。假如我们把这个博弈当做同时行动的博弈，预计会出现什么结果？根据法则2，我们预计，拥有优势策略的一方会采用其优势策略，另一方则会根据对手的优势策略，采取自己的最佳回应策略。由于持枪是歹徒的优势策略，我们应该预计到这就是他们的行动方针。私有房主针对歹徒持枪选择自己的最佳回应策略；他们也应该持枪。尽管双方利益彼此冲突，但仍然可以就一件事达成一致：他们都倾向于谁也不持枪的结果，而不是双方都持枪的结果。怎样的策略行动才能使这个结果出现，并且怎样做才能使这个结果变得可信呢？

我们暂时假设歹徒有本事在同时行动的博弈里先发制人，首先采取一个策略行动。他们将承诺不带枪。而在这个相继行动的博弈里，私有房主并不一定非要预测歹徒可能怎么做。他们将会发现，歹徒已经采取行动，而且没有带枪。于是，私有房主可以选择回应歹徒这一承诺的最佳策略；他们也不打算带枪。这一结果对双方而言都是一种改善。歹徒通过做出一个承诺可以得到更好的结果，这并不出奇，而私有房主的结果也有了改善。双方共同得益的原因在于他们对对方行动的重视胜过对自己行动的重视。私有房主可以允许歹徒实施一个无条件行动，从而扭转其行动。

在现实当中，私有房主们并不会结成一个联合的博弈参与者，歹徒们也不会。即便歹徒作为一个阶级，可以通过采取主动、解除武装得益，这个集团的任何一个成员也还能通过作弊获得额外的优势。这一囚徒困境会破坏歹徒们率先解除武装之举的可信度。他们需要某种其他的方法，使他们可以在一个联合承诺里结为一体。如果该国历来就有严格管制枪支的法律，枪支也就无处可寻。私有房主可以自信地认为歹徒应该没带枪。英国严格的枪支管制迫使歹徒不得不“承诺”不带枪“干活”。这一承诺是可信的，因为他们别无选择。而在美国，枪支广为流行，这等于剥夺了歹徒承诺不带枪“干活”的选择。结果，许多私有房主不得不为自卫而配备枪支。双方的结果同时恶化。

这个博弈从同时行动转向相继行动之际，某种不同寻常的东西产生了。歹徒们选择按他们的优势策略先行。在同时行动的博弈里，他们的优势策略是带枪。而在相继行动的博弈里，他们却没有这么做。理由是在相继行动的博弈里，他们的行动路线会影响私有房主的选择。由于存在这么一种互动关系，他们再也不能认为私有房主的回应不受他们影响。他们先行，所以他们的行动会影响私有房主的选择。在这个相继行动的博弈里，带枪不再是一种优势策略。

posted @ 2023-12-03 12:30 sjmuvx 阅读(50) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部