BZOJ4589 Hard Nim(快速沃尔什变换FWT)

这是我第一道独立做出来的FWT的题目,所以写篇随笔纪念一下。

(这还要纪念,我太弱了)

题目链接:

BZOJ

题目大意:两人玩nim游戏(多堆石子,每次可以从其中一堆取任意多个,不能操作就输)。$T$ 组数据,现在问如果 $n$ 堆石子,每堆石子个数都是不超过 $m$ 的素数,有多少种不同的石子序列使得先手没有必胜策略,答案对 $10^9+7$ 取模。(石子堆顺序不同也算不同)

$1\leq T\leq 80,1\leq n\leq 10^9,1\leq m\leq 5\times 10^4$。


首先肯定要把 $m$ 以内的素数筛出来。

nim游戏的SG函数大家都知道吧!就是它本身。

所以若先手没有必胜策略,那么所有石子堆的石子个数的异或和为 $0$。

考虑 $dp[i][j]$ 为前 $i$ 堆石子,异或和为 $j$ 的石子序列总数。题目要求即为 $dp[n][0]$。

另外令 $g[x]=[x\leq m \&\& x\in prime]$,即若 $x$ 为 $m$ 以内的素数则 $g[x]=1$ 否则 $g[x]=0$。

(以下 $\oplus$ 均代表异或)

那么有边界:

$dp[1][x]=[g[x]==1]$

考虑到 $j\oplus k\oplus k=j$,那么转移方程:

$dp[i][j]=\sum^m_{k=1}dp[i-1][j\oplus k]\quad [g[k]==1]$

这样暴力转移复杂度是 $O(Tm^2n)$ 的,考虑优化。

可以发现 $g[x]=[g[x]==1]$,那么边界和转移方程可以化为:

$dp[1][x]=g[x]$

$dp[i][j]=\sum^m_{k=1}dp[i-1][j\oplus k]g[k]$

发现这其实是个多项式异或卷积的形式(因为 $dp[i-1][j\oplus k]g[k]$ 会贡献到 $dp[i][j]=dp[i][(j\oplus k)\oplus k]$)

那么用 $FWT$ 优化转移。时间复杂度优化至 $O(Tm(\log m)n)$。但还是不够!

我们发现:

$dp[1][x]=g[x]$,也就是 $dp[1]$ 是 $g$ 本身,即异或卷积意义下的 $g^1$

$dp[2][x]=\sum^m_{k=1}dp[1][x\oplus k]g[k]=\sum^m_{k=1}g[x\oplus k]g[k]$,也就是 $dp[2]$ 是异或卷积意义下的 $g^2$

$\dots\dots$

至于 $dp[3]$ 我推不出来

我们科学证明一下:异或卷积是满足结合律的,所以若 $dp[i-1]$ 是 $g^{i-1}$,那么 $dp[i]$ 就是 $dp[i-1]\times g=g^{i-1}\times g=g^i$。

所以 $dp[i]=g^i$。

刚刚说了异或卷积满足结合律,所以可以快速幂加速求 $dp[n]=g^n$,那么 $dp[n][0]$ 也就求完了,问题迎刃而解。

时间复杂度 $O(Tm\log m\log n)$,还差一点点才能通过。

加一个小优化就行了:在快速幂中乘法要乘很多次,如果每乘完一次就要 $O(mlogm)$ 变换就浪费了。可以一开始 $FWT$,快速幂的过程中只有点值相乘没有变换,完了之后再 $FWT$,少了很多运算。

这样就可以用 $O(Tm(\log m+\log n))$ 通过了。

(p.s:$FWT$ 是对模数没有要求的,不要被 $10^9+7$ 吓到了。)


上代码:

#include<bits/stdc++.h>
using namespace std;
const int mod=1000000007,inv=500000004;    //2的逆元为500000004
int n,m,limit;
int a[70070],ans[70070];
int prime[50050],pl;
bool vis[50050];
void FWT(int *c,int type){    //模板
    for(int mid=1;mid<limit;mid<<=1)
        for(int r=mid<<1,j=0;j<limit;j+=r)
            for(int k=0;k<mid;k++){
                int x=c[j+k],y=c[j+k+mid];
                c[j+k]=(x+y)%mod;c[j+k+mid]=(x-y+mod)%mod;
                if(type==-1){
                    c[j+k]=1ll*c[j+k]*inv%mod;c[j+k+mid]=1ll*c[j+k+mid]*inv%mod;
                }
            }
}
void mult(int *a,int *b,int *c){    //点值相乘(为何这里面没有FWT?上面说过这会浪费时间)
    for(int i=0;i<limit;i++) c[i]=1ll*a[i]*b[i]%mod;
}
void quickpow(int *a,int b){
    memset(ans,0,sizeof(ans));
    ans[0]=1;    //初始化
    FWT(a,1);FWT(ans,1);    //一开始就变换
    while(b){    //快速幂
        if(b&1) mult(ans,a,ans);
        mult(a,a,a);
        b>>=1;
    }    //中间不变换
    FWT(a,-1);FWT(ans,-1);    //这时才变换回去
}
void init(){    //筛素数,作为转移数组
    vis[1]=true;
    for(int i=2;i<=50000;i++){
        if(!vis[i]) prime[++pl]=i;
        for(int j=1;j<=pl && i*prime[j]<=50000;j++){
            vis[i*prime[j]]=true;
            if(i%prime[j]==0) break;
        }
    }
}
int main(){
    init();
    while(~scanf("%d%d",&n,&m)){
        memset(a,0,sizeof(a));
        for(limit=1;limit<=m;limit<<=1);
        for(int i=1;i<=pl && prime[i]<=m;i++) a[prime[i]]=1;    //转移数组
        quickpow(a,n);
        printf("%d\n",ans[0]);
    }
}
FWT

 

posted @ 2018-07-19 14:53  ATS_nantf  阅读(152)  评论(0编辑  收藏