【XSY3344】连续段 DP 牛顿迭代 NTT

题目大意

  对于一个长度为 \(n\) 的排列 \(p\),我们称一个区间 \([l,r]\) 是连续的当且仅当 \((\max_{l\leq i\leq r}a_i)-(\min_{l\leq i\leq r}a_i)=r-l\)

  对于两个排列 \(p_1,p_2\),我们称这两个排列是等价的,当且仅当他们的长度相同且连续区间的集合相同。

  给你 \(n\),对于 \(1\leq i\leq n\),所有求 \(i\) 阶排列形成的等价类个数对 \(p\) 取模的值。

  \(n\leq 100000,p=k\times2^{18}+1,k\in \mathbb {N},p\) 是质数。

题解

  对于一个区间 \([l,r]\),如果这个区间的所有子区间都是连续的,就称这个区间为强连续区间。

  每次我们找一个最大的强连续区间,把这个区间内所有点缩到一起。

  如果找不到,就找一个最小的连续区间,把这个区间内所有点缩到一起。

  这个过程就形成了一个树结构。

  • 总共有 \(n\) 个叶子。
  • 对于一个代表强连续区间的点,这个点的儿子个数 \(\geq 2\)
  • 对于一个代表连续区间的点,这个点的儿子个数 \(\geq 4\)。(可以发现,长度为 \(\leq 3\) 的序列是一定有强连续区间的。)

  每一个排列 \(p\) 对应了一棵树。

  对于一棵树,可以构造出一个排列 \(p\)

  那么就只用对这棵树计数了。

  显然可以 \(O(n^2)\) DP。

  记 \(f_i\) 为长度为 \(i\) 的排列的方案数,\(F(x)=\sum_{i\geq 0}f_ix^i\),那么就有:

\[F(x)=\frac{(F(x)^2+F(x)^4)}{1-F(x)}+x \]

  用牛顿迭代法解这个方程即可。

\[(F(x)^2+F(x)^4)\frac{1}{1-F(x)}-F(x)+x=0\\ G(y)=(y^2+y^4)\frac{1}{1-y}-y+x\\ G'(y)=(2y+4y^3)\frac{1}{1-y}+(y^2+y^4)(-\frac{1}{(1-y)^2})(-1)-1\\ G(F(x))\equiv 0\pmod {x^n}\\ G(F(x))\equiv G(F_0(x))+G'(F_0(x))(F(x)-F_0(x)) \pmod {x^n}\\ F(x)\equiv F_0(x)-\frac{G(F_0(x))}{G'(F_0(x))}\pmod {x^n}\\ \]

  时间复杂度:\(O(n\log n)\)

代码

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cstdlib>
#include<ctime>
#include<functional>
#include<cmath>
#include<vector>
#include<assert.h>
//using namespace std;
using std::min;
using std::max;
using std::swap;
using std::sort;
using std::reverse;
using std::random_shuffle;
using std::lower_bound;
using std::upper_bound;
using std::unique;
using std::vector;
typedef long long ll;
typedef unsigned long long ull;
typedef double db;
typedef std::pair<int,int> pii;
typedef std::pair<ll,ll> pll;
void open(const char *s){
#ifndef ONLINE_JUDGE
	char str[100];sprintf(str,"%s.in",s);freopen(str,"r",stdin);sprintf(str,"%s.out",s);freopen(str,"w",stdout);
#endif
}
void open2(const char *s){
#ifdef DEBUG
	char str[100];sprintf(str,"%s.in",s);freopen(str,"r",stdin);sprintf(str,"%s.out",s);freopen(str,"w",stdout);
#endif
}
int rd(){int s=0,c,b=0;while(((c=getchar())<'0'||c>'9')&&c!='-');if(c=='-'){c=getchar();b=1;}do{s=s*10+c-'0';}while((c=getchar())>='0'&&c<='9');return b?-s:s;}
void put(int x){if(!x){putchar('0');return;}static int c[20];int t=0;while(x){c[++t]=x%10;x/=10;}while(t)putchar(c[t--]+'0');}
int upmin(int &a,int b){if(b<a){a=b;return 1;}return 0;}
int upmax(int &a,int b){if(b>a){a=b;return 1;}return 0;}
const int N=270000;
ll p,g;
ll fp(ll a,ll b)
{
	ll s=1;
	for(;b;b>>=1,a=a*a%p)
		if(b&1)
			s=s*a%p;
	return s;
}
namespace ntt
{
	const int W=262144;
	int rev[N];
	int *w[20];
	void init()
	{
		ll s=fp(g,(p-1)/W);
		w[18]=new int[1<<17];
		w[18][0]=1;
		for(int i=1;i<W/2;i++)
			w[18][i]=w[18][i-1]*s%p;
		for(int i=17;i>=1;i--)
		{
			w[i]=new int[1<<(i-1)];
			for(int j=0;j<1<<(i-1);j++)
				w[i][j]=w[i+1][j<<1];
		}
	}
	void ntt(ll *a,int n,int t)
	{
		for(int i=1;i<n;i++)
		{
			rev[i]=(rev[i>>1]>>1)|(i&1?n>>1:0);
			if(rev[i]>i)
				swap(a[i],a[rev[i]]);
		}
		for(int i=2,l=1;i<=n;i<<=1,l++)
			for(int j=0;j<n;j+=i)
				for(int k=0;k<i/2;k++)
				{
					ll u=a[j+k];
					ll v=a[j+k+i/2]*w[l][k];
					a[j+k]=(u+v)%p;
					a[j+k+i/2]=(u-v)%p;
				}
		if(t==-1)
		{
			reverse(a+1,a+n);
			ll inv=fp(n,p-2);
			for(int i=0;i<n;i++)
				a[i]=a[i]*inv%p;
		}
	}
	void add(ll *a,ll *b,ll *c,int n,int m,int l)
	{
		static ll a1[N];
		int k=max(n,m);
		for(int i=0;i<=k;i++)
			a1[i]=0;
		for(int i=0;i<=n;i++)
			a1[i]=(a1[i]+a[i])%p;
		for(int i=0;i<=m;i++)
			a1[i]=(a1[i]+b[i])%p;
		for(int i=0;i<=l;i++)
			c[i]=a1[i];
	}
	void mul(ll *a,ll *b,ll *c,int n,int m,int l)
	{
		static ll a1[N],a2[N];
		int k=1;
		while(k<=n+m)
			k<<=1;
		for(int i=0;i<k;i++)
			a1[i]=a2[i]=0;
		for(int i=0;i<=n;i++)
			a1[i]=a[i];
		for(int i=0;i<=m;i++)
			a2[i]=b[i];
		ntt(a1,k,1);
		ntt(a2,k,1);
		for(int i=0;i<k;i++)
			a1[i]=a1[i]*a2[i]%p;
		ntt(a1,k,-1);
		for(int i=0;i<=l;i++)
			c[i]=(a1[i]+p)%p;
	}
	void getinv(ll *a,ll *b,int n)
	{
		if(n==1)
		{
			b[0]=fp(a[0],p-2);
			return;
		}
		getinv(a,b,n>>1);
		static ll a1[N],a2[N];
		for(int i=0;i<n<<1;i++)
			a1[i]=a2[i]=0;
		for(int i=0;i<n;i++)
			a1[i]=a[i];
		for(int i=0;i<n>>1;i++)
			a2[i]=b[i];
		ntt(a1,n<<1,1);
		ntt(a2,n<<1,1);
		for(int i=0;i<n<<1;i++)
			a1[i]=a2[i]*(2-a1[i]*a2[i]%p)%p;
		ntt(a1,n<<1,-1);
		for(int i=0;i<n;i++)
			b[i]=(a1[i]+p)%p;
	}
}
int e[50],t;
int check(int x)
{
	for(int i=1;i<=t;i++)
		if(fp(x,(p-1)/e[i])==1)
			return 0;
	return 1;
}
void getg()
{
	int _=p-1;
	for(int i=2;i*i<=_;i++)
		if(_%i==0)
		{
			e[++t]=i;
			while(_%i==0)
				_/=i;
		}
	if(_!=1)
		e[++t]=_;
	for(int i=1;;i++)
		if(check(i))
		{
			g=i;
			return;
		}
}
void solve(ll *a,int n)
{
	if(n==1)
		return;
	solve(a,n>>1);
	static ll f1[N],f2[N],f3[N],f4[N],f5[N],a1[N],a2[N],a3[N],a4[N];
	for(int i=0;i<n;i++)
		a1[i]=(p-a[i])%p;
	a1[0]++;
	for(int i=0;i<n;i++)
		f1[i]=a[i];
	ntt::ntt(f1,n<<1,1);
	for(int i=0;i<n<<1;i++)
		f2[i]=f1[i]*f1[i]%p;
	ntt::ntt(f2,n<<1,-1);
	for(int i=0;i<n;i++)
		f4[i]=f2[i];
	ntt::ntt(f4,n<<1,1);
	for(int i=0;i<n<<1;i++)
		f3[i]=f4[i]*f1[i]%p;
	ntt::ntt(f3,n<<1,-1);
	for(int i=0;i<n<<1;i++)
		f4[i]=f4[i]*f4[i]%p;
	ntt::ntt(f4,n<<1,-1);
	for(int i=0;i<n;i++)
		f5[i]=f4[i];
	ntt::ntt(f5,n<<1,1);
	for(int i=0;i<n<<1;i++)
		f5[i]=f5[i]*f1[i]%p;
	ntt::ntt(f5,n<<1,-1);
	for(int i=0;i<n;i++)
		f1[i]=a[i];
	
	for(int i=0;i<n;i++)
		a1[i]=(-f1[i]+3*f2[i]-2*f3[i]+f4[i]-f5[i])%p;
	for(int i=1;i<n;i++)
		a1[i]=(a1[i]-2*f1[i-1]+f2[i-1])%p;
	a1[1]++;
	
	for(int i=0;i<n;i++)
		a2[i]=(4*f1[i]-2*f2[i]+4*f3[i]-3*f4[i])%p;
	a2[0]--;

	ntt::getinv(a2,a3,n);
	ntt::mul(a1,a3,a4,n-1,n-1,n-1);
		
	for(int i=0;i<n;i++)
		a[i]=(a[i]-a4[i]+p)%p;
}
int n;
ll s[N];
int main()
{
	open("b");
	scanf("%d%lld",&n,&p);
	getg();
	ntt::init();
	int k=1;
	while(k<=n)
		k<<=1;
	solve(s,k);
	for(int i=1;i<=n;i++)
	{
		s[i]=(s[i]+p)%p;
		printf("%lld\n",s[i]);
	}
	return 0;
}
posted @ 2018-12-29 08:57  ywwyww  阅读(1236)  评论(0编辑  收藏  举报