51nod 1172 Partial Sums V2 任意模FFT

Partial Sums V2

 

题目连接:


https://www.51nod.com/onlineJudge/questionCode.html#!problemId=1172

 

Description


给出一个数组A,经过一次处理,生成一个 数组S,数组S中的每个值相当于数组A的累加,比如:A = {1 3 5 6} => S = {1 4 9 15}。如果对生成的数组S再进行一次累加操作,{1 4 9 15} => {1 5 14 29},现在给出数组A,问进行K次操作后的结果。(输出结果 Mod 10^9 + 7)


 Input


第1行,2个数N和K,中间用空格分隔,N表示数组的长度,K表示处理的次数(2 <= n <= 50000, 0 <= k <= 10^9, 0 <= a[i] <= 10^9)


Output


共N行,每行一个数,对应经过K次处理后的结果。输出结果 Mod 10^9 + 7。


Sample Input


4 2
1
3
5
6


Sample Output


1
5
14
29


题意:


题解:


考虑每个位置的贡献,所求即$ans[n]=\sum_{i+j=n}^{}C(k-1+i,i)\cdot a[j]$ ,其中 $C(n,i) $表示从 n 个物品里选出 i 个物品的方案数。
上述卷积形式可以利用FFT或NTT加速运算,难点在于答案模 109+7,设其为 P ,这意味这参与卷积的每个元素值为不大于 (P−1) 的非负整数,卷积后的值为不大于 (n+1)⋅(P−1)2=O(nP2) 的值,这个上界可以达到 5⋅1022 。
一种想法是利用3种模意义下的NTT结果进行合并,得到这个可能达到 5⋅1022 的数,再取模,一共需要9次NTT,涉及高精度。
还有一种想法就是降低卷积前的元素值上界,令 M 为满足 P≤M2 的最小正整数,将多项式 f 拆成 f1+f2⋅M 的形式,那么每个元素的值上界是 O(M)=O($\sqrt{p}$) 的,卷积后的值上界是 O(nP) 的,用long double来做FFT差不多可以接受,而卷积可以写为 f∗g=(f1+f2⋅M)∗(g1+g2⋅M)=(f1∗f2)+(f1∗g2+f2∗g1)⋅M+(f2∗g2)⋅M2 ,一共需要7次FFT,不涉及高精度。

 

很邪,51nod上c++会wa,c++11会过..

以前只在大牛的博客上看到过第一种做法,但没有实用性,第二种方法很强。

昨天刚好看到,拉出来封个版


----------


2016-8-18 更新
看到另一种黑科技优化,大概是fft中用了相位的部分,只用4次fft,膜


代码   

 

  1 //#include <bits/stdc++.h>
  2 #include <stdio.h>
  3 #include <iostream>
  4 #include <string.h>
  5 #include <math.h>
  6 #include <stdlib.h>
  7 #include <limits.h>
  8 #include <algorithm>
  9 #include <queue>
 10 #include <vector>
 11 #include <set>
 12 #include <map>
 13 #include <stack>
 14 #include <bitset>
 15 #include <string>
 16 #include <time.h>
 17 using namespace std;
 18 long double esp=1e-11;
 19 //#pragma comment(linker, "/STACK:1024000000,1024000000")
 20 #define fi first
 21 #define se second
 22 #define all(a) (a).begin(),(a).end()
 23 #define cle(a) while(!a.empty())a.pop()
 24 #define mem(p,c) memset(p,c,sizeof(p))
 25 #define mp(A, B) make_pair(A, B)
 26 #define pb push_back
 27 #define lson l , m , rt << 1
 28 #define rson m + 1 , r , rt << 1 | 1
 29 typedef long long int LL;
 30 const long double PI = acos((long double)-1);
 31 const LL INF=0x3f3f3f3fll;
 32 const int MOD =1000000007ll;
 33 const int maxn=140100;
 34 struct complex
 35 {
 36     long double r,i;
 37     complex(long double _r = 0.0,long double _i = 0.0){r = _r; i = _i;}
 38     complex operator +(const complex &b){return complex(r+b.r,i+b.i);}
 39     complex operator -(const complex &b){return complex(r-b.r,i-b.i);}
 40     complex operator *(const complex &b){return complex(r*b.r-i*b.i,r*b.i+i*b.r);}
 41 };
 42 complex conj(complex a){return complex(a.r,-a.i);}
 43 void change(complex y[],int len)
 44 {
 45     int i,j,k;
 46     for(i = 1, j = len/2;i < len-1; i++)
 47     {
 48         if(i < j)swap(y[i],y[j]);
 49         k = len/2;
 50         while( j >= k)
 51         {
 52             j -= k;
 53             k /= 2;
 54         }
 55         if(j < k) j += k;
 56     }
 57 }
 58 void FFT(complex y[],int len,int on)  //len=2^k
 59 {
 60     change(y,len);
 61     for(int h = 2; h <= len; h <<= 1)
 62     {
 63         complex wn(cos(-on*2*PI/h),sin(-on*2*PI/h));
 64         for(int j = 0;j < len;j+=h)
 65         {
 66             complex w(1,0);
 67             for(int k = j;k < j+h/2;k++)
 68             {
 69                 complex u = y[k];
 70                 complex t = w*y[k+h/2];
 71                 y[k] = u+t;
 72                 y[k+h/2] = u-t;
 73                 w = w*wn;
 74             }
 75         }
 76     }
 77     if(on == -1)
 78         for(int i = 0;i < len;i++)
 79             y[i].r /= len;
 80 }
 81 int callen(int len1,int len2){
 82     int len=1;
 83     while(len < (len1<<1) || len < (len2<<1))len<<=1;
 84     return len;
 85 }
 86 LL fftans[maxn];
 87 complex A[maxn],B[maxn],dft[4][maxn],dt[4];
 88 int td[4];
 89 void fft(LL* y1,int len1,LL* y2,int len2,LL mod){
 90     int len=callen(len1,len2);
 91     for(int x=0;x<len1;x++)A[x]=complex(y1[x]&32767,y1[x]>>15);
 92     for(int x=len1;x<len;x++)A[x]=complex(0,0);
 93     for(int x=0;x<len2;x++)B[x]=complex(y2[x]&32767,y2[x]>>15);
 94     for(int x=len2;x<len;x++)B[x]=complex(0,0);
 95     FFT(A,len,1);FFT(B,len,1);
 96     int j;
 97     for(int x=0;x<len;x++)
 98     {
 99         j=(len-x)&(len-1);
100         dt[0]=(A[x]+conj(A[j]))*complex(0.5,0);
101         dt[1]=(A[x]-conj(A[j]))*complex(0,-0.5);
102         dt[2]=(B[x]+conj(B[j]))*complex(0.5,0);
103         dt[3]=(B[x]-conj(B[j]))*complex(0,-0.5);
104         dft[0][j]=dt[0]*dt[2];
105         dft[1][j]=dt[0]*dt[3];
106         dft[2][j]=dt[1]*dt[2];
107         dft[3][j]=dt[1]*dt[3];
108     }
109     for(int x=0;x<len;x++)
110     {
111         A[x]=dft[0][x]+dft[1][x]*complex(0,1);
112         B[x]=dft[2][x]+dft[3][x]*complex(0,1);
113     }
114     FFT(A,len,1);FFT(B,len,1);
115     for(int x=0;x<len;x++)
116     {
117         td[0]=(LL)(A[x].r/len+0.5)%mod;
118         td[1]=(LL)(A[x].i/len+0.5)%mod;
119         td[2]=(LL)(B[x].r/len+0.5)%mod;
120         td[3]=(LL)(B[x].i/len+0.5)%mod;
121         fftans[x]=(td[0]+((LL)(td[1]+td[2])<<15)+((LL)td[3]<<30))%mod;
122     }
123 }
124 LL inv[50001];
125 LL a[maxn],b[maxn];
126 
127 int main()
128 {
129     //freopen("in.txt", "r", stdin);
130     //freopen("inlay.in", "r", stdin);
131     //freopen("out.txt", "w", stdout);      //%I64d
132     //vector<int>::iterator iter;
133     //for(int x=1;x<=n;x++)
134     //for(int y=1;y<=n;y++)
135     //scanf("%d",&a);
136     //printf("%d\n",ans);
137     int n;
138     LL k;
139     scanf("%d%lld",&n,&k);
140     inv[1]=1;
141     for(int x=2;x<n;x++)inv[x]=(MOD-MOD/x)*inv[MOD%x]%MOD;
142     for(int x=0;x<n;x++)
143         scanf("%lld",&a[x]);
144     LL tem=1;
145     b[0]=1;
146     for(int x=1;x<n;x++)
147     {
148         tem=tem*(x+k-1)%MOD*inv[x]%MOD;
149         b[x]=tem;
150     }
151     fft(a,n,b,n,MOD);
152     for(int x=0;x<n;x++)
153         printf("%lld\n",(fftans[x]+MOD)%MOD);
154     return 0;
155 }

 




2016-08-18

posted @ 2016-07-30 23:41  femsub  阅读(1423)  评论(0编辑  收藏  举报