讨论博弈

讨论博弈

原文:towardsdatascience.com/talking-about-games/

博弈论是一个在经济学中相当突出但在其他科学学科中并不受欢迎的研究领域。然而,博弈论中使用的概念可能对更广泛的受众感兴趣,包括数据科学家、统计学家、计算机科学家或心理学家,仅举几个例子。本文是关于博弈论基础的四章教程系列的序言,所以请关注即将到来的文章。

在这篇文章中,我将解释博弈论处理的问题类型,并介绍用于描述博弈的主要术语和概念。我们将看到一些在博弈论中通常分析的博弈示例,并为后续章节中对博弈论能力的更深入洞察奠定基础。但在我们深入细节之前,我想向您介绍一些博弈论的应用,这些应用展示了博弈论概念可以应用于众多领域。

博弈论的应用

即使是薯条也可以是博弈论的应用。照片由 engin akyurtUnsplash 提供

在选举中为一个小党派投票是否有意义,如果这个党派无论如何都没有机会获胜?与提供相同商品的你竞争的对手开始价格战是否值得?如果你减少过度捕捞区域的捕捞率,而你的竞争对手仍然像以前一样继续捕捞,你有什么收获吗?如果你认为政府会在下一次飓风后支付重建费用,那么你应该购买保险吗?你应该如何在即将拍卖你最喜欢的毕加索画作的情况下表现?

所有这些问题(以及更多)都存在于可以用博弈论建模的应用领域。每当一个情况包括与其他人的互动中的战略决策时,博弈论概念就可以应用于正式描述这种情况并寻找不是基于直觉而是基于理性观念的决策。所有上述情况的关键在于你的决策取决于他人的行为。如果每个人都同意保护过度捕捞区域,你想要参与以保护自然,但如果你认为其他人会继续捕鱼,为什么你应该成为唯一一个停止的人?同样,你的选举投票行为可能严重依赖于你对他人投票的假设。如果没有人投票给那个候选人,你的投票将浪费,但如果每个人都这样认为,候选人根本就没有机会。也许有很多人会说“如果其他人也投票给他,我会投票给他”。

类似的情况可能发生在非常不同的情境中。你有没有想过,当你想要叫外卖时,每个人都这么说:“你不用因为我而点任何东西,但如果你还是要点,我可以来点薯条”?所有这些例子都可以是博弈论的应用,所以让我们开始了解博弈论究竟是什么。

理解游戏

在开始玩之前,你需要了解游戏的组成部分。照片由 Laine CooperUnsplash 提供

当你听到“游戏”这个词时,你可能会想到像 Minecraft 这样的视频游戏,像大富翁这样的桌面游戏,或者像扑克这样的卡牌游戏。所有这些游戏都有一些共同的原则:我们总是有一些玩家被允许做游戏规则确定的事情。例如,在扑克中,你可以加注、检查或放弃。在大富翁中,你可以购买你到达的财产或者不购买。我们还必须有关于如何赢得游戏的概念。在扑克中,你必须得到最好的牌才能赢,在大富翁中,你必须是在所有人破产之后最后一个站着的人。这也意味着在某些情况下,某些行动比其他行动更好。如果你手里有两张 A,留在游戏中比放弃更好。

当我们从博弈论的角度看待游戏时,我们使用相同的概念,只是更加正式。

博弈论中的博弈由 n 个玩家组成,其中每个玩家都有一个策略集和一个效用函数。

一个博弈由一组玩家 I = {1, .., n}组成,其中每个玩家都有一个策略集S和一个效用****函数 ui(s1, s2, … sn)。策略集由游戏的规则决定。例如,它可以是 S = {check, raise, give-up},玩家必须决定他们想要使用哪些行动。效用函数 u(也称为奖励)描述了在给定其他玩家的行动的情况下,玩家的某个特定行动的价值。每个玩家都希望最大化他们的效用,但这里有一个棘手的部分:你的行动的效用取决于其他玩家的行动。但对他们来说,情况相同:他们的行动的效用取决于其他玩家的行动(包括你的)。

让我们考虑一个著名的博弈来说明这一点。在剪刀石头布游戏中,我们有 n=2 个玩家,每个玩家可以选择三种行动之一,因此每个玩家的策略集是 S={rock, paper, scissors}。但行动的效用取决于其他玩家的行动。如果我们的对手选择石头,纸的效用就高(1),因为纸能打败石头。但如果你的对手选择剪刀,纸的效用就低(-1),因为你会输。最后,如果你的对手也选择纸,你将达到平局,效用为 0。

图片

当对手选择三种策略时,玩家 1 选择纸的效用值。

而不是为每个情况单独写下效用函数,通常以这种矩阵形式展示游戏:

图片

矩阵的第一位玩家通过选择他的行动来决定矩阵的行,第二位玩家通过选择列来决定。例如,如果玩家 1 选择纸,玩家 2 选择剪刀,我们最终会落在第三列第二行的单元格中。这个单元格中的值是两位玩家的效用,其中第一个值对应玩家 1,第二个值对应玩家 2。(-1,1)表示玩家 1 的效用为-1,玩家 2 的效用为 1。剪刀胜过纸。

更多细节

现在我们已经了解了博弈论中游戏的主要组成部分。让我再补充一些关于博弈论是什么以及它使用哪些假设来描述其情景的提示。

  • 我们通常假设玩家同时选择他们的行动(比如在剪刀石头布游戏中)。我们称这样的游戏为静态游戏。也存在动态游戏,其中玩家轮流决定他们的行动(比如在国际象棋中)。我们将在本教程的后续章节中考虑这些情况。

  • 在博弈论中,通常假设玩家不能相互沟通,因此他们在决定行动之前不能达成协议。在剪刀石头布游戏中,你当然不希望这样做,但还有其他游戏,沟通会使选择行动变得更容易。然而,我们始终假设沟通是不可能的。

  • 博弈论被认为是一个规范性理论,而不是描述性理论。这意味着我们将分析游戏,关注“什么会是合理的解决方案?”这并不总是现实世界中类似情况下人们所做的事情。对真实人类行为的这种描述是行为经济学研究领域的部分,它位于心理学和经济学的交界处。

囚徒困境

图片

囚徒困境的全部内容就是不要陷入这种境地。图片由De an SunUnsplash提供

通过观察一些典型的游戏,我们可以更熟悉博弈论的主要概念,这些游戏经常被分析。通常,这类游戏来源于现实世界中可能发生的故事或情景,需要人们在某些行动之间做出选择。以下是一个这样的故事:

假设我们有两个被怀疑犯有罪行的罪犯。警方有一些间接证据,但没有实际证据证明他们的罪行。因此,他们审问这两个罪犯,现在他们必须决定是想承认罪行还是否认。如果你是其中一个罪犯的情况,你可能会认为否认总是比承认好,但现在到了棘手的部分:警方提出了一项交易给你。如果你在伙伴否认的情况下承认,你将被视为证人,将不会受到惩罚。在这种情况下,你可以自由离开,但你的伙伴将被判入狱六年。听起来像是一笔好交易,但请注意,结果也取决于你伙伴的行动。如果你俩都承认,就没有证人了,你们俩都将被判入狱三年。如果你俩都否认,警方只能使用间接证据对你进行指控,这将导致你和你的伙伴都将被判入狱一年。但请注意,你的伙伴也被提供了同样的交易。如果你否认而他承认,他就是证人,你将被判入狱六年。你该如何决定?

图片

囚徒困境。

从这个故事中衍生出的游戏被称为囚徒困境,它是博弈论中游戏的典型例子。我们可以像之前用剪刀石头布一样将其可视化为一个矩阵,在这个矩阵中,我们很容易看到玩家所处的困境。如果你们俩都否认,他们将受到相对较低的惩罚。但如果你假设你的伙伴会否认,你可能会倾向于承认,这样可以防止你入狱。但你的伙伴可能也会有同样的想法,如果你们俩都承认,你们俩都将被判入狱更长时间。这样的游戏很容易让人陷入困境。我们将在本教程的下一章中讨论这个问题的解决方案。首先,让我们考虑一些更多的例子。

巴赫 vs. 斯特拉文斯基

图片

你更喜欢巴赫还是斯特拉文斯基?照片由SigmundUnsplash提供

你和你的朋友想一起去听音乐会。你是巴赫音乐的粉丝,但你的朋友更喜欢俄罗斯 20 世纪的作曲家伊戈尔·斯特拉文斯基。然而,你们俩都希望避免在任何一场音乐会上独自一人。尽管你更喜欢巴赫而不是斯特拉文斯基,但你宁愿和你的朋友一起去斯特拉文斯基的音乐会,也不愿独自去听巴赫的音乐会。我们可以为这个游戏创建一个矩阵:

图片

巴赫 vs. 斯特拉文斯基

你通过去巴赫或斯特拉文斯基的音乐会来决定行,而你的朋友通过去任何一场音乐会来决定列。对你来说,最好的情况是你们都选择巴赫。你的奖励将是 2 分,而你的朋友将得到 1 分的奖励,这对他来说比他独自在斯特拉文斯基的音乐会上要好。然而,如果他和你一起在斯特拉文斯基的音乐会上,他会更高兴。

你还记得我们说过玩家在做出决定之前不允许交流吗?这个例子说明了原因。如果你只是互相打电话决定去哪里,这就不再是游戏理论可以研究的游戏了。但你不能互相打电话,所以你只能去任何一场音乐会,希望在那里遇到你的朋友。你会怎么做?

解除武装还是升级?

图片

爱情而非战争。照片由 Artem BeliaikinUnsplash 提供

第三个例子把我们带到了国际政治的领域。如果世界上枪支更少,世界会是一个更快乐的地方,不是吗?然而,如果国家考虑解除武装,它们也必须考虑其他国家做出的选择。如果美国解除武装,苏联可能会想要重新武装,以便能够攻击美国——至少在冷战期间是这样的思考。这样的场景可以用以下矩阵来描述:

图片

解除武装与升级游戏的矩阵。

正如你所见,当两个国家都解除武装时,它们会获得最高的奖励(每个 3 分),因为世界上枪支更少,战争的风险最小化。然而,如果你解除武装,而对手升级,对手就会处于更好的位置,并获得 2 分的奖励,而你只能得到 0 分。再次,升级自己可能更好,这对两个玩家都有 1 分的奖励。这比只有你自己解除武装要好,但不如两个国家都解除武装的情况好。

解决方案?

所有这些例子都有一个共同点:没有一种选择总是最好的。相反,一个玩家的行动效用总是取决于另一个玩家的行动,而这反过来又取决于第一个玩家的行动,以此类推。现在博弈论感兴趣的是寻找最优解,并决定什么才是理性的行动;也就是说,最大化预期奖励的行动。关于这种解决方案具体是什么样的不同想法将是本系列下一章 章节 的内容。

摘要

图片

学习博弈论就像玩游戏一样有趣,你不这么认为吗?照片由 Christopher Paul HighUnsplash 提供

在继续阅读下一章中寻找解决方案之前,让我们回顾一下到目前为止我们已经学到了什么。

  • 一款游戏由玩家组成,他们决定行动,这些行动具有效用奖励

  • 行动的效用/奖励取决于其他玩家的行动。

  • 静态游戏中,玩家同时决定他们的行动。在动态游戏中,他们轮流进行。

  • 囚徒困境是博弈论中一个非常流行的游戏例子。

  • 如果没有单一的行动比其他任何行动都好,游戏就会变得更有趣。

现在你已经熟悉了在博弈论中如何描述游戏,你可以查看下一章来学习如何在博弈论中寻找游戏的解决方案。

参考文献

这里介绍的主题通常在标准的博弈论教科书中都有涉及。我主要使用了这本,尽管它是用德语写的:

  • Bartholomae, F.,& Wiens, M. (2016). 博弈论:一本应用导向的教科书. Wiesbaden: Springer Fachmedien Wiesbaden.

英文的一个替代版本可以是这个:

  • Espinola-Arredondo, A.,& Muñoz-Garcia, F. (2023). 博弈论:带步骤示例的入门. Springer Nature.

博弈论是一个相对较新的研究领域,第一本主要教科书是这本:

  • Von Neumann, J.,& Morgenstern, O. (1944). 博弈论与经济行为理论。

喜欢这篇文章吗? 关注我 以获取我的未来文章通知。

posted @ 2026-03-28 10:03  布客飞龙III  阅读(1)  评论(0)    收藏  举报