博客园 首页 私信博主 显示目录 隐藏目录 管理

SG博弈

首先介绍什么是组合游戏
在竞赛中,组合游戏的题目一般有以下特点
题目描述一般为AA      AA,BB      BB 2人做游戏
AA      AA BB      BB交替进行某种游戏规定的操作,每操作一次,选手可以在有限的操作(操作必须合法)集合中任选一种。
对于游戏的任何一种可能的局面,合法的操作集合只取决于这个局面本身,不取决于其它因素(跟选手,以前的所有操作无关)
如果当前选手无法进行合法的操作,则为负
 
举个例子现在有一个数0,小明小红2人每次可以轮流在当前数加 1~3,谁先凑到21谁就赢
这个描述就符合上面的条件:
小明小红(满足1)
每次轮流在当前数上加1~3(满足2)
当前能进行的操作只取决于这个数本身(也就是这个局面),如果这个数为20,可操作的集合为+{1},如果为12,可操作的集合为+{1,2,3}(满足3)
如果数字已经为21了,则不可能往上在加数字,可操作集合为ΦΦ      \PhiΦ,当前选手为负(满足4)
 
必胜点和必败点的概念
必败点(P点) 前一个(previous player)选手将取胜的点称为必败点
必胜点(N点) 下一个(next player)选手将取胜的点称为必胜点
比如现在数字已经为18了,那么当前操作人只要给数字+3则必胜,我们就把在此位置称为必胜点
 
必胜点和必败点的性质
- 所有的终结点都是必败点
- 从任何必胜点操作,至少有一种方式进入必败点
- 无论如何操作, 从必败点都只能进入必胜点.
Sprague-Grundy(SG)定理
游戏和的SG函数等于各个游戏SG函数的Nim和。这样就可以将每一个子游戏分而治之,从而简化了问题。而Bouton定理就是Sprague-Grundy定理在Nim游戏中的直接应用,因为单堆的Nim游戏 SG函数满足 SG(x) = x。
Nim和 :  各个数相异或的结果
SG函数
先定义mex(minimal excludant)运算,这是施加于一个集合的运算,表最小的不属于这个集合的非负整数。例如mex{0,1,2,4}=3、mex{2,3,5}=0、mex{}=0。
对于任意状态 x , 定义 SG(x) = mex(S),其中 SS      SS是 xx      xx 后继状态的SGSG      SGSG函数值的集合。如 x 有三个后继状态分别为 SG(a),SG(b),SG(c)SG(a),SG(b),SG(c)      SG(a),SG(b),SG(c)SG(a),SG(b),SG(c),那么SG(x)=mexSG(x)=mex      SG(x) = mexSG(x)=mex{SG(aSG(a      SG(aSG(a,SG(b)SG(b)      SG(b)SG(b),SG(c)SG(c)      SG(c)SG(c)}。 这样 集合SS      SS 的终态必然是空集,所以SG函数的终态为 SG(x)=0SG(x)=0      SG(x) = 0SG(x)=0,当且仅当 x 为必败点P时。
取石子问题
有1堆n个的石子,每次只能取{ 1, 3, 4 }个石子,先取完石子者胜利,那么各个数的SG值为多少?
SG[0]=0,f[]={1,3,4},
x=1 时,可以取走1 - f{1}个石子,剩余{0}个,所以 SG[1] = mex{ SG[0] }= mex{0} = 1;
x=2 时,可以取走2 - f{1}个石子,剩余{1}个,所以 SG[2] = mex{ SG[1] }= mex{1} = 0;
x=3 时,可以取走3 - f{1,3}个石子,剩余{2,0}个,所以 SG[3] = mex{SG[2],SG[0]} = mex{0,0} =1;
x=4 时,可以取走4-  f{1,3,4}个石子,剩余{3,1,0}个,所以 SG[4] = mex{SG[3],SG[1],SG[0]} = mex{1,1,0} = 2;
x=5 时,可以取走5 - f{1,3,4}个石子,剩余{4,2,1}个,所以SG[5] = mex{SG[4],SG[2],SG[1]} =mex{2,0,1} = 3;
以此类推…
x        0  1  2  3  4  5  6  7  8…
SG[x]    0  1  0  1  2  3  2  0  1…
由上述实例我们就可以得到SG函数值求解步骤,那么计算1~n的SG函数值步骤如下:
1、使用 数组f 将 可改变当前状态 的方式记录下来。
2、然后我们使用 另一个数组 将当前状态x 的后继状态标记。
3、最后模拟mex运算,也就是我们在标记值中 搜索 未被标记值 的最小值,将其赋值给SG(x)。
4、我们不断的重复 2 - 3 的步骤,就完成了 计算1~n 的函数值。
 1 //f[N]:可改变当前状态的方式,N为方式的种类,f[N]要在getSG之前先预处理
 2 //SG[]:0~n的SG函数值
 3 //S[]:为x后继状态的集合
 4 int f[N],SG[MAXN],S[MAXN];
 5 void  getSG(int n){
 6     int i,j;
 7     memset(SG,0,sizeof(SG));
 8     //因为SG[0]始终等于0,所以i从1开始
 9     for(i = 1; i <= n; i++){
10         //每一次都要将上一状态 的 后继集合 重置
11         memset(S,0,sizeof(S));
12         for(j = 0; f[j] <= i && j <= N; j++)
13             S[SG[i-f[j]]] = 1;  //将后继状态的SG函数值进行标记
14         for(j = 0;; j++) if(!S[j]){   //查询当前后继状态SG值中最小的非零值
15             SG[i] = j;
16             break;
17         }
18     }
19 }

内容转自:https://blog.csdn.net/bestsort/article/details/88197959

posted @ 2019-08-15 17:22  Brave_WTZ  阅读(213)  评论(0编辑  收藏  举报