纳什均衡 纯策略 混合策略

case:

1、

囚徒困境博弈

A╲B   坦白   抵赖
坦白 -8,-8   0,-10
抵赖 -10,0  -1,-1
 
2、
 
你\朋友
朋友出正面
朋友出反面
你出正面
+3,-3
-2,+2
你出反面
-2,+2
+1,-1
 
假设我们出正面的概率是x,反面的概率是1-x,朋友出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出什么的时候我们的收益都相等(不然在这个游戏中,对方可以改变正反面出现的概率让我们的期望收入减少),由此列出方程就是
纳什均衡

https://baike.baidu.com/item/纳什均衡/0?fromModule=lemma_inlink

 纳什均衡是博弈论中一种解的概念,它是指满足下面性质的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变)都不会提高自身的收益。

 

纳什均衡可以分成两类:“纯策略纳什均衡”和“混合策略纳什均衡”。
 
所谓纯策略是提供给玩家要如何进行博弈的一个完整的定义。特别地是,纯策略决定在任何一种情况下要做的移动。策略集合是由玩家能够施行的纯策略所组成的集合。
而混合策略是对每个纯策略分配一个概率而形成的策略。混合策略允许玩家随机选择一个纯策略。混合策略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现收益最优。因为概率是连续的,所以即使策略集合是有限的,也会有无限多个混合策略。
 
当然,严格来说,每个纯策略都是一个“退化”的混合策略,某一特定纯策略的概率为1,其他的则为0。
 
故“纯策略纳什均衡”,即参与之中的所有玩家都使用纯策略;而相应的“混合策略纳什均衡”,之中至少有一位玩家使用混合策略。并不是每个博弈都会有纯策略纳什均衡,例如“钱币问题"就只有混合策略纳什均衡,而没有纯策略纳什均衡。不过,还是有许多博弈有纯策略纳什均衡(如协调博弈,囚徒困境和猎鹿博弈)。甚至,有些博弈能同时有纯策略和混合策略均衡。
 
 
 
 
 
posted @ 2017-01-19 17:10  papering  阅读(201)  评论(0)    收藏  举报