[学习笔记]博弈论

nim游戏

[学习笔记]nim游戏

公平组合游戏

就是一般的博弈,先手后手选择相同、交替行动,正负判定是能不能动为准。

SG函数

对于单独的游戏,0/1足以表示必胜必败态

SG函数主要处理多个游戏组合起来,即公平组合游戏

SG函数xor值为0,必败,否则必胜

SG函数定义为所有后继状态的mex值

其实只要规定好终态SG函数并且方便转移,公平组合游戏都可以用SG函数刻画

Every-SG 游戏

每个子游戏必须同时进行的组合游戏。

一个DAG上有多个棋子,每次选择所有能移动的棋子沿着有向边移动。

谁不能移动了谁输。

(最后一个棋子归位才是关键)

 

直观上感觉,要将必胜态保持更长,要将必败态保持更短

 

先找出必胜必败态,

当前是必胜态,D(T)=max(D(T'))+1

当前是必败态,D(T)=min(D(T'))+1

 

---------------------------------------------------------------------------------upda:2020.9.20

这个算法好像假了

直接用sg函数搞掉就行了。

无非就是把取数形象化了。

 

混合博弈

根据当前情况以一定概率决策

混合策略游戏

大概决策如下两种:
真诚(问自己没有的)欺骗(问自己有的)

再考虑对方“认为你真诚”,“认为你虚假”,做出的决策和你获胜的关系,


T-T:m/(m+1)(1-f(m-1,n))
T-F:1/(m+1)+m/(m+1)*(1-f(m-1,n))
F-T:1
F-F:1-f(m,n-1)
推出式子,求交点

假如以先手以P概率真诚,

最大化:
max(min(pm/(m+1)*(1-f(m-1,n))+(1-p),p/(m+1)+p*m/(m+1)(1-f(m-1,n))+(1-p)(1-f(m,n-1)))

f(m-1,n)和f(m,n-1)递归下去,

P是横坐标的话,

 

其实就是,两个直线求交点,横坐标的概率就是最优决策了,由最高处的纵坐标,再得到获胜的概率

例题

posted @ 2019-02-24 18:10  *Miracle*  阅读(302)  评论(0编辑  收藏  举报