BZOJ 3172:后缀数组

题意:给N个单词组成的文章,输出每一个单词出现的次数

思路:连接后求sa,对每一个单词求lcp>=len[i]的最大范围

加了二分也没有快多少。。

#include"cstdio"
#include"queue"
#include"cmath"
#include"stack"
#include"iostream"
#include"algorithm"
#include"cstring"
#include"queue"
#include"map"
#include"set"
#include"vector"
#define LL long long
#define mems(a,b) memset(a,b,sizeof(a))
#define ls pos<<1
#define rs pos<<1|1
#define max(a,b) (a)>(b)?(a):(b)
using namespace std;

const int MAXN = 1e6+500;
const int INF = 0x3f3f3f;

int r[MAXN],len[205];
char arr[MAXN];
int sa[MAXN],_rank[MAXN];
int wa[MAXN],wb[MAXN],wv[MAXN],Ws[320];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
void get_sa(int *r,int *sa,int n,int m){
  int i,j,p,*x=wa,*y=wb,*t;
  for(i=0;i<m;i++) Ws[i]=0;
  for(i=0;i<n;i++) Ws[x[i]=r[i]]++;
  for(i=1;i<m;i++) Ws[i]+=Ws[i-1];
  for(i=n-1;i>=0;i--) sa[--Ws[x[i]]]=i;
  for(j=1,p=1;p<n;j*=2,m=p){
    for(p=0,i=n-j;i<n;i++) y[p++]=i;
    for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
    for(i=0;i<n;i++) wv[i]=x[y[i]];
    for(i=0;i<m;i++) Ws[i]=0;
    for(i=0;i<n;i++) Ws[wv[i]]++;
    for(i=1;i<m;i++) Ws[i]+=Ws[i-1];
    for(i=n-1;i>=0;i--) sa[--Ws[wv[i]]]=y[i];
    for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
      x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
  }
}

int height[MAXN];
void get_height(int *r,int *sa,int n){
  int i,j,k=0;
  for(i=1;i<=n;i++) _rank[sa[i]]=i;
  for(i=0;i<n;height[_rank[i++]]=k)
  for(k?k--:0,j=sa[_rank[i]-1];r[i+k]==r[j+k];k++);
  return;
}

int dp[MAXN][21];
void make_rmq(int N){
  for(int i=0;i<=N;i++) dp[i][0]=height[i];
  for(int j=1;(1<<j)<=N;j++)
  for(int i=1;i+(1<<j)-1<N;i++) dp[i][j]=min(dp[i][j-1],dp[i+(1<<(j-1))][j-1]);
}

int query(int l,int r){
  if(l>r) swap(l,r);
  l++;
  int k=(int)(log((r-l+1)*1.0)/log(2.0));
  return min(dp[l][k],dp[r-(1<<k)+1][k]);
}

void solve(int p,int l,int L){
  int R=_rank[p];
  int left=R,right=R;
  int low=0,high=R-1,mid;
  while(low<=high){
    mid=(low+high)>>1;
    if(query(mid,R)>=l) left=mid,high=mid-1;
    else low=mid+1;
  }
  low=R+1,high=L;
  while(low<=high){
    mid=(low+high)>>1;
    if(query(R,mid)>=l) right=mid,low=mid+1;
    else high=mid-1;
  }
  printf("%d\n",right-left+1);
}

int main(){
  int n;
  while(~scanf("%d",&n)){
    int l=0;
    for(int i=0;i<n;i++){
      scanf("%s",arr);
      len[i]=strlen(arr);
      for(int j=0;j<len[i];j++) r[l++]=arr[j];
      if(i!=n-1)r[l++]='$';
    }
    r[l++]=0;
    get_sa(r,sa,l,300);
    get_height(r,sa,l-1);
    make_rmq(l);
    int pos=0;
    for(int i=0;i<n;i++){
      solve(pos,len[i],l);
      pos+=len[i]+1;
    }
  }
  return 0;
}
View Code

 

posted @ 2016-03-18 00:43  Septher  阅读(177)  评论(0编辑  收藏  举报