BZOJ 3172:后缀数组

题意:给N个单词组成的文章,输出每一个单词出现的次数

思路:连接后求sa,对每一个单词求lcp>=len[i]的最大范围

加了二分也没有快多少。。

#include"cstdio"
#include"queue"
#include"cmath"
#include"stack"
#include"iostream"
#include"algorithm"
#include"cstring"
#include"queue"
#include"map"
#include"set"
#include"vector"
#define LL long long
#define mems(a,b) memset(a,b,sizeof(a))
#define ls pos<<1
#define rs pos<<1|1
#define max(a,b) (a)>(b)?(a):(b)
using namespace std;

const int MAXN = 1e6+500;
const int INF = 0x3f3f3f;

int r[MAXN],len[205];
char arr[MAXN];
int sa[MAXN],_rank[MAXN];
int wa[MAXN],wb[MAXN],wv[MAXN],Ws[320];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
void get_sa(int *r,int *sa,int n,int m){
    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0;i<m;i++) Ws[i]=0;
    for(i=0;i<n;i++) Ws[x[i]=r[i]]++;
    for(i=1;i<m;i++) Ws[i]+=Ws[i-1];
    for(i=n-1;i>=0;i--) sa[--Ws[x[i]]]=i;
    for(j=1,p=1;p<n;j*=2,m=p){
        for(p=0,i=n-j;i<n;i++) y[p++]=i;
        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
        for(i=0;i<n;i++) wv[i]=x[y[i]];
        for(i=0;i<m;i++) Ws[i]=0;
        for(i=0;i<n;i++) Ws[wv[i]]++;
        for(i=1;i<m;i++) Ws[i]+=Ws[i-1];
        for(i=n-1;i>=0;i--) sa[--Ws[wv[i]]]=y[i];
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
}

int height[MAXN];
void get_height(int *r,int *sa,int n){
    int i,j,k=0;
    for(i=1;i<=n;i++) _rank[sa[i]]=i;
    for(i=0;i<n;height[_rank[i++]]=k)
    for(k?k--:0,j=sa[_rank[i]-1];r[i+k]==r[j+k];k++);
    return;
}

int dp[MAXN][21];
void make_rmq(int N){
    for(int i=0;i<=N;i++) dp[i][0]=height[i];
    for(int j=1;(1<<j)<=N;j++)
    for(int i=1;i+(1<<j)-1<N;i++) dp[i][j]=min(dp[i][j-1],dp[i+(1<<(j-1))][j-1]);
}

int query(int l,int r){
    if(l>r) swap(l,r);
    l++;
    int k=(int)(log((r-l+1)*1.0)/log(2.0));
    return min(dp[l][k],dp[r-(1<<k)+1][k]);
}

void solve(int p,int l,int L){
    int R=_rank[p];
    int left=R,right=R;
    int low=0,high=R-1,mid;
    while(low<=high){
        mid=(low+high)>>1;
        if(query(mid,R)>=l) left=mid,high=mid-1;
        else low=mid+1;
    }
    low=R+1,high=L;
    while(low<=high){
        mid=(low+high)>>1;
        if(query(R,mid)>=l) right=mid,low=mid+1;
        else high=mid-1;
    }
    printf("%d\n",right-left+1);
}

int main(){
    int n;
    while(~scanf("%d",&n)){
        int l=0;
        for(int i=0;i<n;i++){
            scanf("%s",arr);
            len[i]=strlen(arr);
            for(int j=0;j<len[i];j++) r[l++]=arr[j];
            if(i!=n-1)r[l++]='$';
        }
        r[l++]=0;
        get_sa(r,sa,l,300);
        get_height(r,sa,l-1);
        make_rmq(l);
        int pos=0;
        for(int i=0;i<n;i++){
            solve(pos,len[i],l);
            pos+=len[i]+1;
        }
    }
    return 0;
}
View Code

 

posted @ 2016-03-18 00:43  Septher  阅读(177)  评论(0编辑  收藏  举报