博客园 首页 私信博主 显示目录 隐藏目录 管理 动画

BZOJ.3992.[SDOI2015]序列统计(DP NTT 原根)

题目链接


\(Description\)
给定\(n,m,x\)和集合\(S\)。求\(\prod_{i=1}^na_i\equiv x\ (mod\ m)\)的方案数。其中\(a_i\in S\)
\(n\leq10^9,3\leq m\leq 8000且m是质数,1\leq x\leq m-1\)

\(Solution\)
\(f_{i,j}\)表示当前选了\(i\)个数,乘积模\(m\)\(j\)的方案数,\(g_i=[i\in S]\)
转移就是,

\[f_{i,a*b\%m}=\sum f_{i-1,a}*g_b \]

每次转移是一样的,所以可以快速幂计算,即\(f_{2i,a*b\%m}=\sum f_{i,a}*f_{i,b}\)
虽然把\(n\)优化到了\(\log n\),但这样转移复杂度还是\(O(m^2)\)的。

我们发现,只要能把\(a*b\%m\)写成\((a+b)\%m\),就是一个循环卷积的形式了。
把乘法变成加法可以想到取对数,同样在模意义下可以用离散对数

\(m\)的一个原根\(g\)\(g,g^2,...,g^{m-1}\)在模\(m\)意义下互不相同。所以我们可以用满足\(g^A\equiv a\ (mod\ m)\)的正整数\(A\)来替换掉\(a\)(即\(a\)\(m\)的指标\(I(a)\)),它是唯一的。
那么\(a*b\equiv g^A*g^B\equiv g^{A+B}\equiv g^{(A+B)\%\varphi(m)}\ (mod\ m)\)
所以转移就成了:

\[f_{i,(A+B)\%(m-1)}=\sum f_{i-1,A}*g_B \]

\(g_{A+B}=\sum f_{i-1,A}*g_B\),那么\(f_{i,j\%(m-1)}=g_j+g_{j+m-1}\)
可以用\(NTT\)优化。

同样,每一次的转移还是一样的,依旧可以用多项式快速幂。
复杂度\(O(m\log m\log n)\)

当然取\(g^0,g^1,...,g^{m-2}\)也行,因为多项式下标以\(0\)开始方便些。
这样如果集合里有\(0\)要特判忽略掉它。
因为是循环卷积所以每次快速幂乘的时候都需要把\(f\)求出来,也就是一定要再\(NTT\)得到系数表示,不能一直用点值表示做。(是这样吧?)


//1876kb	3684ms(怎么这么慢啊...)
#include <cstdio>
#include <cctype>
#include <cstring>
#include <algorithm>
#define gc() getchar()
#define G 3
#define invG 334845270
#define mod 1004535809
#define Mod(x) x>=mod&&(x-=mod)
#define Add(x,v) (x+=v)>=mod&&(x-=mod)
#define Mul(x,y) (1ll*x*y%mod)
typedef long long LL;
const int N=32500;

int inv,I[N],x[N],t[N],rev[N];

inline int read()
{
	int now=0;register char c=gc();
	for(;!isdigit(c);c=gc());
	for(;isdigit(c);now=now*10+c-'0',c=gc());
	return now;
}
inline int FP(int x,int k,int p)
{
	int t=1;
	for(; k; k>>=1,x=1ll*x*x%p)
		if(k&1) t=1ll*t*x%p;
	return t;
}
int Get_root(int P)
{
	static int p[10005];
	int cnt=0,t=P-1;
	for(int i=2; i*i<=t; ++i)
		if(!(t%i))
		{
			p[++cnt]=i;
			while(!(t%i)) t/=i;
		}
	if(t>1) p[++cnt]=t;
	for(int x=2; ; ++x)
	{
		bool ok=1;
		for(int i=1; i<=cnt; ++i) if(FP(x,(P-1)/p[i],P)==1) {ok=0; break;}
		if(ok) return x;
	}
	return 1;
}
void Pre(int m)
{
	int g=Get_root(m);
	for(int i=0,pw=1; i<m-1; ++i) I[pw]=i, pw=1ll*pw*g%m;//g^i=pw -> I(pw)=i
}
void NTT(int *a,int lim,int opt)
{
	for(int i=1; i<lim; ++i) if(i<rev[i]) std::swap(a[i],a[rev[i]]);
	for(int i=2; i<=lim; i<<=1)
	{
		int mid=i>>1,Wn=FP(~opt?G:invG,(mod-1)/i,mod);
		for(int j=0; j<lim; j+=i)
			for(int k=j,w=1,t; k<j+mid; ++k,w=1ll*w*Wn%mod)
				a[k+mid]=a[k]-(t=1ll*a[k+mid]*w%mod)+mod, Mod(a[k+mid]),
				a[k]+=t, Mod(a[k]);
	}
	if(opt==-1) for(int i=0,inv=::inv; i<lim; ++i) a[i]=1ll*a[i]*inv%mod;
}
void Mult1(int *f,int n,int lim)//x*x可以少一次NTT啊 
{
	NTT(f,lim,1);
	for(int i=0; i<lim; ++i) f[i]=1ll*f[i]*f[i]%mod;
	NTT(f,lim,-1);
	for(int i=0; i<n; ++i) f[i]=f[i]+f[i+n], Mod(f[i]);//f[i+m-1]
	for(int i=n; i<lim; ++i) f[i]=0;//!
}
void Mult2(int *a,int *b,int *res,int n,int lim)
{
	static int f[N],g[N];
	memset(f,0,sizeof f), memset(g,0,sizeof g);
	memcpy(f,a,n<<2), memcpy(g,b,n<<2);
	NTT(f,lim,1), NTT(g,lim,1);
	for(int i=0; i<lim; ++i) f[i]=1ll*f[i]*g[i]%mod;
	NTT(f,lim,-1);
	for(int i=0; i<n; ++i) res[i]=f[i]+f[i+n], Mod(res[i]);//f[i+m-1] //要保证res的n项以外为0 
}

int main()
{
	static int x[N],res[N];
	int n=read(),m=read(),X=read(),S=read();
	Pre(m), --m;//0~m-1

	int lim=1,l=-1;
	while(lim<=m+m-2) lim<<=1,++l;
	for(int i=1; i<lim; ++i) rev[i]=(rev[i>>1]>>1)|((i&1)<<l);
	inv=FP(lim,mod-2,mod);

	for(int i=1,s; i<=S; ++i) s=read(), s&&(++x[I[s]]);//++f[1][s]
	res[I[1]]=1;//f[0][1]=1
	for(int k=n; k; k>>=1,Mult1(x,m,lim))
		if(k&1) Mult2(res,x,res,m,lim);
	printf("%d\n",res[I[X]]);

	return 0;
}
posted @ 2018-11-30 20:47  SovietPower  阅读(2150)  评论(0编辑  收藏  举报