bzoj 3944: Sum【莫比乌斯函数+欧拉函数+杜教筛】

一道杜教筛的板子题。
两个都是积性函数,所以做法是一样的。以mu为例,设\( f(n)=\sum_{d|n}\mu(d) g(n)=\sum_{i=1}^{n}f(i) s(n)=\sum_{i=1}^{n}\mu(i) \),然后很显然对于mu\( g(n)=1\),对于phi\( g(n)=n*(n+1)/2 \),然后可以这样转化一下:

\[g(n)=\sum_{i=1}^{n}\sum_{d|n}\mu(d) \]

\[=\sum_{d=1}^{n}\mu(d)\left \lfloor \frac{n}{d} \right \rfloor \]

\[=\sum_{d=1}^{n}s(\left \lfloor \frac{n}{d} \right \rfloor) \]

\[s(n)=g(n)-\sum_{d=2}^{n}s(\left \lfloor \frac{n}{d} \right \rfloor) \]

然后递归求解子问题即可。
时间复杂度据说是预处理三分之二的部分加上记忆化可以到\( O(n^{\frac{2}{3}}) \)。当然我并不会算……
p.s 因为是分块来做,所以没必要用map来记忆化。因为预处理了三分之二的部分,所以需要递归计算的x一定大于\( n^{\frac{2}{3}} \),这意味着\( \frac{n}{x} \)的数组取值在可接受的范围之内,事实上,这个数组往往非常小,并且因为分块,所以同一个下标上存的是同一个块的答案,不会冲突。(然而我跑的和map一样慢是怎么回事……

#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
const int N=5000005,m=5000000;
int T,n,tot,q[N];
long long phi[N],mb[N],hphi[5005],hmb[5005];
bool v[N],vmb[5005],vphi[5005];
long long wkmb(long long x)
{
	if(x<=m) 
		return mb[x];
	if(vmb[n/x])
		return hmb[n/x];
	vmb[n/x]=1;
	long long re=1ll;
	for(long long i=2,la;i<=x;i=la+1)
	{
		la=x/(x/i);
		re-=(long long)(la-i+1)*wkmb(x/i);
	}
	return hmb[n/x]=re;
}
long long wkphi(long long x)
{
	if(x<=m) 
		return phi[x];
	if(vphi[n/x])
		return hphi[n/x];
	vphi[n/x]=1;
	long long re=(long long)x*(x+1)/2;
	for(long long i=2,la;i<=x;i=la+1)
	{
		la=x/(x/i);
		re-=(long long)(la-i+1)*wkphi(x/i);
	}
	return hphi[n/x]=re;
}
int main()
{
	phi[1]=mb[1]=1;
	for(int i=2;i<=m;i++)
	{
		if(!v[i])
		{
			q[++tot]=i;
			mb[i]=-1;
			phi[i]=i-1;
		}
		for(int j=1;j<=tot&&i*q[j]<=m;j++)
		{
			long long k=i*q[j];
			v[k]=1;
			if(i%q[j]==0)
			{
				mb[k]=0;
				phi[k]=phi[i]*q[j];
				break;
			}
			mb[k]=-mb[i];
			phi[k]=phi[i]*(q[j]-1);
		}
	}
	for(int i=1;i<=m;i++)
	{
		phi[i]+=phi[i-1];
		mb[i]+=mb[i-1];
	}
	scanf("%lld",&T);
	while(T--)
	{
		memset(vmb,0,sizeof(vmb));
		memset(vphi,0,sizeof(vphi));
		scanf("%lld",&n);
		printf("%lld %lld\n",wkphi(n),wkmb(n));
	}
	return 0;
}
posted @ 2018-01-22 15:44  lokiii  阅读(182)  评论(0编辑  收藏  举报