SP687 REPEATS - Repeats(后缀数组)

一个初步的想法是我们枚举重复子串的长度\(L\)。然后跑一遍SA。然后我们枚举一个点\(i\),令他的对应点为\(i+L\),然后求出这两个点的LCP和LCS的长度答案就是这个点的答案就是\((len(LCP)+len(LCS)+L-1)/L\)。这个可以用跟\(EXKMP\)的类似的方法证明。
但是这样会T。
那么如何优化?我们在\(1,1+L,1+L*2...\)这些位置设置关键点(这个方法比较常见)。然后枚举每一个点改成每一个关键点。这样为什么会对?当我们对一个不是关键点的点求\(LCP\)\(LCS\)时。如果\(LCP\)\(LCS\)过关键点,那么和从关键点求\(LCS\),和\(LCP\)没有区别。如果不过时,那么这两个串就不连在一起,对答案没有贡献。
设置了关键点之后,复杂度变成了调和级数级别。

#include<iostream>
#include<cstring>
#include<cstdio>
#include<cmath>
#include<algorithm>
using namespace std;
const int N=100100;
int ans,T,n;
struct SA{
	int c[N],x[N],y[N],m,sa[N],rk[N],height[N],mn[N][20];
	char s[N];
	void get_sa(){
		for(int i=1;i<=m;i++)c[i]=0;
		for(int i=1;i<=n;i++)c[x[i]=s[i]]++;
		for(int i=1;i<=m;i++)c[i]+=c[i-1];
		for(int i=n;i>=1;i--)sa[c[x[i]]--]=i;
		for(int k=1;k<=n;k<<=1){
			int num=0;
			for(int i=n-k+1;i<=n;i++)y[++num]=i;
			for(int i=1;i<=n;i++)if(sa[i]>k)y[++num]=sa[i]-k;
			for(int i=1;i<=m;i++)c[i]=0;
			for(int i=1;i<=n;i++)c[x[i]]++;
			for(int i=1;i<=m;i++)c[i]+=c[i-1];
			for(int i=n;i>=1;i--)sa[c[x[y[i]]]--]=y[i],y[i]=0;
			for(int i=1;i<=n;i++)swap(x[i],y[i]);
			x[sa[1]]=1;num=1;
			for(int i=2;i<=n;i++)
				x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?num:++num;
			if(n==num)break;
			m=num;
		}
	}
	void get_height(){
		int k=0;
		for(int i=1;i<=n;i++)rk[sa[i]]=i;
		for(int i=1;i<=n;i++){
			if(rk[i]==1)continue;
			if(k)k--;
			int j=sa[rk[i]-1];
			while(i+k<=n&&j+k<=n&&s[i+k]==s[j+k])k++;
			height[rk[i]]=k;
		}
	}
	void pre_work(){
		for(int i=1;i<=n;i++)mn[i][0]=height[i];
		int len=log2(n);
		for(int j=1;j<=len;j++)
			for(int i=1;i+(1<<j)-1<=n;i++)
				mn[i][j]=min(mn[i][j-1],mn[i+(1<<j-1)][j-1]);
	}
	int getlcp(int l,int r){
		if(l>r)swap(l,r);
		l++;
//		cout<<l<<" "<<r<<"aaaaa"<<endl;	
		int len=log2(r-l+1);	
		return min(mn[l][len],mn[r-(1<<len)+1][len]);
	}
}A,B;
int read(){
	int sum=0,f=1;char ch=getchar();
	while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();}
	while(ch>='0'&&ch<='9'){sum=sum*10+ch-'0';ch=getchar();}
	return sum*f;
}
int main(){
	T=read();
	while(T--){
		n=read();
		ans=0;
		A.m=B.m=122;
		for(int i=1;i<=n;i++)cin>>A.s[i],B.s[n-i+1]=A.s[i];
		A.get_sa();A.get_height();A.pre_work();
		B.get_sa();B.get_height();B.pre_work();
		for(int i=1;i<=n;i++)
			for(int j=1;j+i<=n;j+=i)
				ans=max(ans,(A.getlcp(A.rk[j],A.rk[j+i])+B.getlcp(B.rk[n-j+1],B.rk[n-j-i+1])+i-1)/i);
		printf("%d\n",ans);
	}
	return 0;
}
posted @ 2019-01-05 09:18  Xu-daxia  阅读(249)  评论(0编辑  收藏  举报