纳什均衡 纯策略 混合策略
case:
1、
囚徒困境博弈
A╲B 坦白 抵赖
坦白 -8,-8 0,-10
抵赖 -10,0 -1,-1
2、
|
你\朋友
|
朋友出正面
|
朋友出反面
|
|
你出正面
|
+3,-3
|
-2,+2
|
|
你出反面
|
-2,+2
|
+1,-1
|
假设我们出正面的概率是x,反面的概率是1-x,朋友出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出什么的时候我们的收益都相等(不然在这个游戏中,对方可以改变正反面出现的概率让我们的期望收入减少),由此列出方程就是
https://baike.baidu.com/item/纳什均衡/0?fromModule=lemma_inlink
纳什均衡是博弈论中一种解的概念,它是指满足下面性质的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变)都不会提高自身的收益。
纳什均衡可以分成两类:“纯策略纳什均衡”和“混合策略纳什均衡”。
所谓纯策略是提供给玩家要如何进行博弈的一个完整的定义。特别地是,纯策略决定在任何一种情况下要做的移动。策略集合是由玩家能够施行的纯策略所组成的集合。
而混合策略是对每个纯策略分配一个概率而形成的策略。混合策略允许玩家随机选择一个纯策略。混合策略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现收益最优。因为概率是连续的,所以即使策略集合是有限的,也会有无限多个混合策略。
当然,严格来说,每个纯策略都是一个“退化”的混合策略,某一特定纯策略的概率为1,其他的则为0。
故“纯策略纳什均衡”,即参与之中的所有玩家都使用纯策略;而相应的“混合策略纳什均衡”,之中至少有一位玩家使用混合策略。并不是每个博弈都会有纯策略纳什均衡,例如“钱币问题"就只有混合策略纳什均衡,而没有纯策略纳什均衡。不过,还是有许多博弈有纯策略纳什均衡(如协调博弈,囚徒困境和猎鹿博弈)。甚至,有些博弈能同时有纯策略和混合策略均衡。

浙公网安备 33010602011771号