SPOJ694/DISUBSTR:Distinct Substrings——题解

https://vjudge.net/problem/SPOJ-DISUBSTR

https://www.luogu.org/problemnew/show/SP694

http://www.spoj.com/problems/DISUBSTR/en/

给定一个字符串,求不相同的子串的个数。

参考罗穗骞论文。

显然一个子串可以定义为一个后缀的前缀。

我们还可以求出来相邻排名的后缀之间的最长公共前缀的长度。

答案就是所有子串数量-所有height。

(其实大胆猜想,不用证明即可(滑稽))

说下原理。

首先height数组含义可以转换成两个后缀的公共前缀个数。

原问题等价于求所有后缀之间不同的前缀个数。

那么按照排名加入的新的后缀suffix(sa[k])时,它会产生(n-sa[k]+1)个新的前缀,但是有height[k]个前缀是重复的,且和前面加入的所有后缀之间重复的前缀最多也不超过height[k]个(显然)。

所以只有height[k]个重复,我们把它扣掉即可。

#include<algorithm>
#include<iostream>
#include<cstring>
#include<cctype>
#include<cstdio>
#include<vector>
#include<queue>
#include<cmath>
using namespace std;
const int N=1010;
char s[N];
int n,rk[N],sa[N],height[N],w[N];
inline bool pan(int *x,int i,int j,int k){
    int ti=i+k<n?x[i+k]:-1;
    int tj=j+k<n?x[j+k]:-1;
    return x[i]==x[j]&&ti==tj;
}
inline void SA_init(){
    int *x=rk,*y=height,r=256;
    for(int i=0;i<r;i++)w[i]=0;
    for(int i=0;i<n;i++)w[s[i]]++;
    for(int i=1;i<r;i++)w[i]+=w[i-1];
    for(int i=n-1;i>=0;i--)sa[--w[s[i]]]=i;
    r=1;x[sa[0]]=0;
    for(int i=1;i<n;i++)
    x[sa[i]]=s[sa[i]]==s[sa[i-1]]?r-1:r++;
    for(int k=1;r<n;k<<=1){
    int yn=0;
    for(int i=n-k;i<n;i++)y[yn++]=i;
    for(int i=0;i<n;i++)
        if(sa[i]>=k)y[yn++]=sa[i]-k;
    for(int i=0;i<r;i++)w[i]=0;
    for(int i=0;i<n;i++)++w[x[y[i]]];
    for(int i=1;i<r;i++)w[i]+=w[i-1];
    for(int i=n-1;i>=0;i--)sa[--w[x[y[i]]]]=y[i];
    swap(x,y);r=1;x[sa[0]]=0;
    for(int i=1;i<n;i++)
        x[sa[i]]=pan(y,sa[i],sa[i-1],k)?r-1:r++;
    }
    for(int i=0;i<n;i++)rk[i]=x[i];
}
inline void height_init(){
    int i,j,k=0;
    for(i=1;i<=n;i++)rk[sa[i]]=i;
    for(i=0;i<n;i++){
    if(k)k--;
    else k=0;
    j=sa[rk[i]-1];
    while(s[i+k]==s[j+k])k++;
    height[rk[i]]=k;
    }
}
int main(){
    int t;
    scanf("%d",&t);
    while(t--){
    cin>>s;
    n=strlen(s);
    n++;
    SA_init();
    n--;
    height_init();
    int ans=(1+n)*n/2;;
    for(int i=2;i<=n;i++)ans-=height[i];
    printf("%d\n",ans);
    }
    return 0;
}

+++++++++++++++++++++++++++++++++++++++++++

 +本文作者:luyouqi233。               +

 +欢迎访问我的博客:http://www.cnblogs.com/luyouqi233/+

+++++++++++++++++++++++++++++++++++++++++++

posted @ 2018-02-24 12:56  luyouqi233  阅读(236)  评论(0编辑  收藏  举报