7.30 NOI模拟赛 B Easy Sum 分块 NTT

LINK:Easy Sum

avatar
avatar

考试的时候一脸懵逼 想不通这个\(n^2\)的还能怎么优化.

事实上暴力\(n^2\)有30~40 而我脸黑 只有30 很气...

把点抽象到杨辉三角上可以发现这是若干个行上的K个点求和 如果是对列上求和或者总体求和就好做的多.

另外一种\(n^2\)是 这n个点从\((a_i,b_i)\)这个位置走到\((0,k)\)

实际上在图上进行dp求方案 很多神仙使用滚动数组+循环展开\(n^2\)暴力过了这道题.

正解是这样的:

将坐标分块 这样做是方便后续的转移.

考虑隔B分上一块然后我们维护每一列的的dp值 从上一块dp到下一块.

每次由上一列dp到下一列需要做一个前缀和的东西(实际上是后缀和.

其实就是乘以多项式\(\frac{1}{(1-x)}\)跳B列就乘以\(\frac{1}{(1-x)^B}\)

可能会有疑问为什么不直接跳第一列而是一块一块跳.

在跳的过程中存在一个点要对下一列有贡献了 所以我们此时暴力加上贡献还是\(n^2\)的.

不妨考虑加到上一次要跳的那一列 这样计算出自己需要res次前缀和 那么就是给上次的列的多项式加上一个\(x^y\cdot (1-x)^{B-res}\)

这个多项式最长只有B所以就可以接受了.

总复杂度为\(n\cdot B+\frac{n}{B}\cdot nlogn\) 显然当B取\(\sqrt{nlogn}\)时最优.

代码写的很容易理解.

这个思路是真的妙 建议一写.

code
//#include<bits/stdc++.h>
#include<iostream>
#include<cstdio>
#include<ctime>
#include<cctype>
#include<queue>
#include<deque>
#include<stack>
#include<iostream>
#include<iomanip>
#include<cstdio>
#include<cstring>
#include<string>
#include<ctime>
#include<cmath>
#include<cctype>
#include<cstdlib>
#include<queue>
#include<deque>
#include<stack>
#include<vector>
#include<algorithm>
#include<utility>
#include<bitset>
#include<set>
#include<map>
#define ll long long
#define db double
#define INF 1000000000
#define inf 1000000000000000ll
#define ldb long double
#define pb push_back
#define put_(x) printf("%d ",x);
#define get(x) x=read()
#define gt(x) scanf("%d",&x)
#define gi(x) scanf("%lf",&x)
#define put(x) printf("%d\n",x)
#define putl(x) printf("%lld\n",x)
#define rep(p,n,i) for(RE int i=p;i<=n;++i)
#define go(x) for(int i=lin[x];i;i=nex[i])
#define fep(n,p,i) for(RE int i=n;i>=p;--i)
#define vep(p,n,i) for(RE int i=p;i<n;++i)
#define pii pair<int,int>
#define mk make_pair
#define RE register
#define P 13331ll
#define gf(x) scanf("%lf",&x)
#define pf(x) ((x)*(x))
#define uint unsigned long long
#define ui unsigned
#define EPS 1e-5
#define sq sqrt
#define S second
#define F first
#define mod 998244353
#define md 1000000007
#define max(x,y) ((x)<(y)?y:x)
#define a(i) t[i].a
#define b(i) t[i].b
using namespace std;
char buf[1<<15],*fs,*ft;
inline char getc()
{
	return (fs==ft&&(ft=(fs=buf)+fread(buf,1,1<<15,stdin),fs==ft))?0:*fs++;
}
inline int read()
{
	RE int x=0,f=1;RE char ch=getc();
	while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getc();}
	while(ch>='0'&&ch<='9'){x=x*10+ch-'0';ch=getc();}
	return x*f;
}
inline ll Read()
{
	RE ll x=0,f=1;RE char ch=getc();
	while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getc();}
	while(ch>='0'&&ch<='9'){x=x*10+ch-'0';ch=getc();}
	return x*f;
}
const int MAXN=350010,maxn=100010,N=2000,G=3;
int lim=1,n,B,m,INV,IG;
int fac[MAXN],inv[MAXN],h[N][N];
int f[MAXN],g[MAXN],rev[MAXN],O[MAXN];
struct wy{int a,b;}t[maxn];
vector<int>w[N];
inline int ksm(int b,int p)
{
	int cnt=1;
	while(p)
	{
		if(p&1)cnt=(ll)cnt*b%mod;
		b=(ll)b*b%mod;p=p>>1;
	}
	return cnt;
}
inline int C(int a,int b){return (ll)fac[a]*inv[b]%mod*inv[a-b]%mod;}
inline int add(int x,int y){return x+y>=mod?x+y-mod:x+y;}
inline void NTT(int *a,int op)
{
	vep(0,lim,i)if(i<rev[i])swap(a[i],a[rev[i]]);
	for(int len=2;len<=lim;len=len<<1)
	{
		int mid=len>>1;
		int wn=ksm(op==1?G:IG,(mod-1)/len);
		vep(1,mid,j)O[j]=(ll)O[j-1]*wn%mod;
		for(int j=0;j<lim;j+=len)
		{
			vep(0,mid,i)
			{
				int x=(ll)a[i+j+mid]*O[i]%mod;
				a[i+j+mid]=(a[i+j]-x+mod)%mod;
				a[i+j]=add(a[i+j],x);
			}
		}
	}
	if(op==-1)vep(0,lim,i)a[i]=(ll)a[i]*INV%mod;
}
inline bool cmp(wy x,wy y){return x.a<y.a;}
int main()
{
	//freopen("1.in","r",stdin);
	n=read();B=(int)sqrt(n*20*1.0);
	rep(1,n,i)get(a(i)),get(b(i));
	lim=1;while(lim<=2*n)lim=lim<<1;
	vep(0,lim,i)rev[i]=rev[i>>1]>>1|((i&1)?lim>>1:0);
	m=n+B;INV=ksm(lim,mod-2);IG=ksm(G,mod-2);O[0]=1;
	fac[0]=1;rep(1,m,i)fac[i]=(ll)fac[i-1]*i%mod;
	inv[m]=ksm(fac[m],mod-2);fep(m-1,0,i)inv[i]=(ll)inv[i+1]*(i+1)%mod;
	rep(0,n,i)g[i]=C(i+B-1,B-1);
	
	NTT(g,1);//NTT(g,-1);
	
	rep(0,B,i)
	rep(0,i,j)
	h[i][j]=(ll)C(i,j)*((j&1)?mod-1:1)%mod;
	
	sort(t+1,t+1+n,cmp);int BB=n/B+1;
	
	rep(1,n,i)w[a(i)/B+1].pb(i);
	
	fep(BB,1,k)
	{
		
		vep(0,(int)w[k].size(),j)
		{
			
			int id=w[k][j];
			
			int y=n-b(id);

			int res=a(id)%B+1;
			//(1-x)^{B-res}*x^y
			
			rep(0,B-res,i)if(y+i<=n)f[y+i]=add(f[y+i],h[B-res][i]);
		}
		
		NTT(f,1);
		
		vep(0,lim,i)f[i]=(ll)f[i]*g[i]%mod;
		
		NTT(f,-1);
		vep(n+1,lim,i)f[i]=0;
	}
	
	rep(0,n-1,i)printf("%d ",f[n-i]);
	
	return 0;
}
posted @ 2020-08-01 15:51  chdy  阅读(240)  评论(0编辑  收藏  举报