bzoj 4310: 跳蚤【后缀数组+st表+二分+贪心】

先求一下SA
本质不同的子串个数是\( \sum n-sa[i]+1-he[i] \),按字典序二分子串,判断的时候贪心,也就是从后往前扫字符串,如果当前子串串字典序大于二分的mid子串就切一下,然后计一共有多少段

#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
const int N=100005;
int n,k,b[N],wa[N],wb[N],wv[N],wsu[N],sa[N],rk[N],he[N],st[20][N<<1],ls,rs;
char s[N];
bool cmp(int r[],int a,int b,int l)
{
	return r[a]==r[b]&&r[a+l]==r[b+l];
}
void saa(char r[],int n,int m)
{
	int *x=wa,*y=wb;
	for(int i=0;i<=m;i++)
		wsu[i]=0;
	for(int i=1;i<=n;i++)
		wsu[x[i]=r[i]]++;
	for(int i=1;i<=m;i++)
		wsu[i]+=wsu[i-1];
	for(int i=n;i>=1;i--)
		sa[wsu[x[i]]--]=i;
	for(int j=1,p=1;j<=n&&p<n;j<<=1,m=p)
	{
		p=0;
		for(int i=n-j+1;i<=n;i++)
			y[++p]=i;
		for(int i=1;i<=n;i++)
			if(sa[i]>j)
				y[++p]=sa[i]-j;
		for(int i=1;i<=n;i++)
			wv[i]=x[y[i]];
		for(int i=0;i<=m;i++)
			wsu[i]=0;
		for(int i=1;i<=n;i++)
			wsu[wv[i]]++;
		for(int i=1;i<=m;i++)
			wsu[i]+=wsu[i-1];
		for(int i=n;i>=1;i--)
			sa[wsu[wv[i]]--]=y[i];
		swap(x,y);
		x[sa[1]]=1;
		p=1;
		for(int i=2;i<=n;i++)
			x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p:++p;
	}
	for(int i=1;i<=n;i++)
		rk[sa[i]]=i;
	for(int i=1,j,k=0;i<=n;he[rk[i++]]=k)
		for(k?k--:0,j=sa[rk[i]-1];r[i+k]==r[j+k];k++);
	for(int i=1;i<=n;i++)
		st[0][i]=he[i];
	for(int i=1;(1<<i)<=n;i++)
		for(int j=1;j+(1<<i)-1<=n;j++)
			st[i][j]=min(st[i-1][j],st[i-1][j+(1<<(i-1))]);
}
int ques(int x,int y)
{
	if(x==y)
		return n-x+1;
	int l=min(rk[x],rk[y])+1,r=max(rk[x],rk[y]),k=b[r-l+1];
	if(l>r||r>n)
		return 0;
	return min(st[k][l],st[k][r-(1<<k)+1]);
}
void gtk(long long k)
{
	for(int i=1;i<=n;i++)
	{
		long long nw=n-sa[i]+1-he[i];
		if(nw<k)
			k-=nw;
		else
		{
			ls=sa[i],rs=ls+he[i]+k-1;
			break;
		}
	}
}
bool bj(int l1,int r1,int l2,int r2)
{
	int len1=r1-l1+1,len2=r2-l2+1,len=ques(l1,l2);
	if(len>=len2&&len1>len2)
		return 1;
	if(len>=len1&&len2>=len1)
		return 0;
	if(len>=len1&&len>=len2)
		return len1>len2;
	return s[l1+len]>s[l2+len];
}
bool ok(long long w)
{
	gtk(w);
	int con=1,la=n;
	for(int i=n;i>=1;i--)
	{
		if(s[i]>s[ls])
			return 0;
		if(bj(i,la,ls,rs))
			con++,la=i;
		if(con>k)
			return 0;
	}
	return 1;
}
int main()
{
	scanf("%d%s",&k,s+1);
	n=strlen(s+1);
	b[0]=-1;
	for(int i=1;i<=n;i++)
		b[i]=b[i>>1]+1;
	saa(s,n,200);
	long long l=1,r=0,ans=0;
	for(int i=1;i<=n;i++)
		r+=n-sa[i]+1-he[i];//cerr<<r<<endl;
	ans=r;
	// for(int i=1;i<=n;i++)
		// cerr<<sa[i]<<" "<<he[i]<<endl;
	while(l<=r)
	{
		long long mid=(l+r)>>1;
		if(ok(mid))
			r=mid-1,ans=mid;
		else
			l=mid+1;
	}
	gtk(ans);
	for(int i=ls;i<=rs;i++)
		printf("%c",s[i]);
	return 0;
}
posted @ 2018-09-28 15:05  lokiii  阅读(141)  评论(0编辑  收藏  举报