【学习笔记】CF700E Cool Slogans

服了,做这道题还要重新学一遍 S A M SAM SAM,泪目了。

先不考虑复杂度,考虑一段子串 [ i , j ] [i,j] [i,j]对应的答案。尽量将问题往 S A M SAM SAM上去靠,发现子串 [ i , j ] [i,j] [i,j]对应的就是从 t 0 t_0 t0出发的一条链。假设转移过去的子串是 [ i ′ , j ′ ] [i',j'] [i,j],如果 j ′ = j j'=j j=j那么转移到的点一定是后缀树上的祖先节点,总之这个转移可以提前预处理出来。如果 j ′ ≠ j j'\ne j j=j那么相当于就是在链上取 max ⁡ \max max。又因为 S A M SAM SAM的节点个数是线性的所以直接 D P DP DP,这道题就做完了。

这是我做这道题的第一想法,但是其实我们可以再冷静的分析一步。先不考虑交叉的情况,简单画一个图可以发现最优方案中 s i − 1 s_{i-1} si1一定是 s i s_i si的后缀。这样我们就不用管建出来的 D A G DAG DAG,只需要考虑后缀树上的情形了,因为后缀树对应后缀链接。

比较让人纠结的地方在于,同一等价类对应的答案相同吗?这就涉及到我们对 S A M SAM SAM基本性质的了解了。抛出一个结论:设 s s s是节点 u u u对应的最长串, v v v u u u的祖先,那么 v v v对应的所有字符串在 s s s中的匹配情况相同。证明的关键在于利用 endpos \text{endpos} endpos集合相同。感觉这个证明脑补一下应该不难就略过了。这也说明了一件事,对后缀性质的充分理解才是解决问题的关键。

最后是关于实现。直接暴力二分的复杂度是 O ( n log ⁡ 2 n ) O(n\log^2 n) O(nlog2n)。但是因为是在树上所以能做的操作还是比较多的,比如说这道题就可以根据父亲的信息来计算,注意到一条链上的 D P DP DP值是连续的,并且相邻两个位置的 D P DP DP值不超过 1 1 1,因此可以做到线性。这个地方的处理还是比较巧妙的。复杂度 O ( n log ⁡ n ) O(n\log n) O(nlogn)

就是模板有点长。

打了一发代码,感觉最恶心的地方还是在于在 S A M SAM SAM上维护一些比较繁琐的信息。如果对 S A M SAM SAM不熟悉的话还是很容易搞错的。

#include<bits/stdc++.h>
#define ll long long
#define fi first
#define se second
#define pb push_back
#define db double
#define inf 0x3f3f3f3f3f3f3f3f
#define uint unsigned int
using namespace std;
const int N=4e5+5;
const int M=N*20;
int n,tot,last,rt[N],nums[N],cnt,degree[N],ls[M],rs[M],totnodes,dp[N],fr[N],res;
string s;
queue<int>Q;
struct node{
    int link,len,ch[26],pos;
}t[N];
void ins(int &rt,int l,int r,int x){
    if(!rt)rt=++totnodes;
    if(l==r)return;
    int mid=l+r>>1;
    x<=mid?ins(ls[rt],l,mid,x):ins(rs[rt],mid+1,r,x);
}
void extend(int c,int x){
    int cur=++tot;
    t[cur].len=t[last].len+1;
    t[cur].pos=x;
    int p=last;
    while(p!=-1&&!t[p].ch[c]){
        t[p].ch[c]=cur;
        p=t[p].link;
    }
    if(p==-1){
        t[cur].link=0;
    }
    else{
        //assert(t[p].ch[c]);
        int q=t[p].ch[c];
        assert(q);
        if(t[q].len==t[p].len+1){
            t[cur].link=q;
        }
        else{
            int clone=++tot;
            t[clone].link=t[q].link,t[clone].len=t[p].len+1;for(int i=0;i<26;i++)t[clone].ch[i]=t[q].ch[i];t[clone].pos=x;
            t[cur].link=clone;
            t[q].link=clone;
            while(p!=-1&&t[p].ch[c]==q){
                t[p].ch[c]=clone;
                p=t[p].link;
            } 
        }
    }
    last=cur;
    ins(rt[cur],0,n-1,x);
}
int merge(int p,int q,int l,int r){
    if(l>r)return 0;
    if(!p||!q)return p+q;
    int o=++totnodes,mid=l+r>>1;
    ls[o]=merge(ls[p],ls[q],l,mid);
    rs[o]=merge(rs[p],rs[q],mid+1,r);
    return o;
}
int query(int p,int l,int r,int ql,int qr){
    if(!p)return 0;
    if(ql<=l&&r<=qr)return 1;
    int mid=l+r>>1;
    if(ql<=mid&&query(ls[p],l,mid,ql,qr))return 1;
    if(mid<qr&&query(rs[p],mid+1,r,ql,qr))return 1;
    return 0;
}
signed main(){
    //freopen("data.in","r",stdin);
    ios::sync_with_stdio(false);
    cin.tie(0),cout.tie(0);
	cin>>n>>s;t[0].link=-1;
	for(int i=0;i<n;i++){
        extend(s[i]-'a',i);
    }
    for(int i=1;i<=tot;i++)degree[t[i].link]++;
    for(int i=1;i<=tot;i++){
        if(degree[i]==0){
            Q.push(i);
        }
    }
    while(Q.size()){
        int u=Q.front(),v=t[u].link;Q.pop();
        nums[++cnt]=u;
        if(v){
            rt[v]=merge(rt[v],rt[u],0,n-1);
            if(--degree[v]==0)Q.push(v);
        }
    }for(int i=1;i<=tot;i++)assert(degree[i]==0);
    assert(cnt==tot);
    for(int i=cnt;i>=1;i--){
        int x=nums[i],y=t[x].link;
        if(fr[y]==0||query(rt[fr[y]],0,n-1,t[x].pos-t[x].len+t[fr[y]].len,t[x].pos-1)){
            dp[x]=dp[fr[y]]+1;
            fr[x]=x;
        }
        else{
            dp[x]=dp[fr[y]];
            fr[x]=fr[y];
        }
        res=max(res,dp[x]);
    }
    cout<<res;
}
posted @ 2023-06-30 11:18  仰望星空的蚂蚁  阅读(11)  评论(0)    收藏  举报  来源