BZOJ 4310: 跳蚤

Description

将字符串分成\(k\)段,让子串字典序最大的尽量小。

Solution

后缀数组+二分。

二分最大的子串,然后\(O(n)\)的判断即可。

Code

/**************************************************************
    Problem: 4310
    User: BeiYu
    Language: C++
    Result: Accepted
    Time:1284 ms
    Memory:14288 kb
****************************************************************/
 
#include <bits/stdc++.h>
using namespace std;
 
#define mpr make_pair
 
typedef long long LL;
typedef pair<int,int> pr;
const int N = 100050;
const int M = 23;
 
int n,m=26,k;
char s[N];
int a[N];
int pw[M],lg[N];
 
namespace SuffixArray {
    int t1[N],t2[N],c[N],sa[N],rk[N],ht[N];
    int st[N][M];
    LL w[N];
     
    void get_sa(int a[],int n=::n,int m=::m) {
        int *x=t1,*y=t2;
        for(int i=1;i<=m;i++) c[i]=0;
        for(int i=1;i<=n;i++) c[x[i]=a[i]]++;
        for(int i=1;i<=m;i++) c[i]+=c[i-1];
        for(int i=n;i;--i) sa[c[x[i]]--]=i;
        for(int k=1,p=0;k<n;k<<=1,p=0) {
            for(int i=n-k+1;i<=n;i++) y[++p]=i;
            for(int i=1;i<=n;i++) if(sa[i]>k) y[++p]=sa[i]-k;
            for(int i=1;i<=m;i++) c[i]=0;
            for(int i=1;i<=n;i++) c[x[i]]++;
            for(int i=1;i<=m;i++) c[i]+=c[i-1];
            for(int i=n;i;--i) sa[c[x[y[i]]]--]=y[i];
            swap(x,y),x[sa[1]]=p=1;
            for(int i=2;i<=n;i++) 
                x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?p:++p;
            if(p>=n) break;
            m=p;
        }
    }
    void get_ht(int a[],int n=::n) {
        for(int i=1;i<=n;i++) rk[sa[i]]=i;
        for(int i=1,j,k=0;i<=n;ht[rk[i++]]=k) 
            for(j=sa[rk[i]-1],k=k?k-1:k;a[i+k]==a[j+k];k++);
    }
    void get_st(int n=::n) {
        for(int i=1;i<=n;i++) st[i][0]=ht[i];
        for(int j=1;j<M;j++) for(int i=1;i<=n;i++) if(i+pw[j]-1<=n)
            st[i][j]=min(st[i][j-1],st[i+pw[j-1]][j-1]);
    }
    void get_w(int n=::n) {
        for(int i=1;i<=n;i++) w[i]=w[i-1]+n-sa[i]+1-ht[i];
    }
    void init(int a[],int n=::n,int m=::m) {
        pw[0]=1;for(int i=1;i<M;i++) pw[i]=pw[i-1]<<1;
        lg[0]=-1;for(int i=1;i<N;i++) lg[i]=lg[i>>1]+1;
        get_sa(a,n,m),get_ht(a,n);
        get_st(n),get_w(n);
//      for(int i=1;i<=n;i++) cout<<sa[i]<<" ";cout<<endl;
//      for(int i=1;i<=n;i++) cout<<ht[i]<<" ";cout<<endl;
//      for(int i=1;i<=n;i++) cout<<w[i]<<" ";cout<<endl;
    }
    pr get_lr(LL k) {
        for(int i=1;i<=n;i++) if(w[i]>=k) return mpr(sa[i],sa[i]+k-w[i-1]+ht[i]-1);
    }
    int qur(int x,int y) {
        x=rk[x],y=rk[y];
        if(x==y) return n-sa[x]+1;
        if(x>y) swap(x,y);x++;
        int lg2=lg[y-x+1];
        return min(st[x][lg2],st[y-pw[lg2]+1][lg2]);
    }
    int cmp(int x1,int y1,int x2,int y2) {//1>=2
        int lcp=qur(x1,x2),l1=y1-x1+1,l2=y2-x2+1;
//      cout<<lcp<<" "<<l1<<" "<<l2<<endl;
        if(l1<=lcp) { if(l2<=lcp) return l1>=l2;else return 0; }
        else{ if(l2<=lcp) return 1;else return a[x1+lcp]>a[x2+lcp]; }
    }
};
 
#define x first
#define y second
using namespace SuffixArray;
 
int chk(int k,int l,int r) {
    int cut=n,cnt=0;
    for(int i=n;i;--i) {
        if(s[i]>s[l]) return 0;
        if(!cmp(l,r,i,cut)) cnt++,cut=i;
        if(cnt>k) return 0;
    }return 1;
}
 
void Solve(int k) {
    LL mx=a[1],l=1,r=w[n],md;
//  for(int i=1;i<=n;i++) mx=max(mx,(LL)a[i]);
//  for(int i=1;i<=n;i++) if(a[sa[i]]==mx) { l=w[i-1];break; }
    pr b;
    for(;l<=r;) {
        md=(l+r)>>1;
        b=get_lr(md);
//      cout<<md<<" "<<b.x<<" "<<b.y<<endl;
        if(!chk(k,b.x,b.y)) l=md+1;
        else r=md-1;
    }
    b=get_lr(l);
    for(int i=b.x;i<=b.y;i++) putchar(s[i]);
    putchar('\n');
}
 
 
int main() {
    scanf("%d",&k);
    scanf("%s",s+1);
    n=strlen(s+1);
    for(int i=1;i<=n;i++) a[i]=s[i]-'a'+1;
    init(a,n,m);
    Solve(k-1);
    return 0;
}

  

posted @ 2017-03-30 08:36  北北北北屿  阅读(146)  评论(0编辑  收藏  举报