一点对后缀自动机的理解 及模板

题目描述

给定一个只包含小写字母的字符串SS,

请你求出 SS 的所有出现次数不为 11 的子串的出现次数乘上该子串长度的最大值。​​

 

 

先讲讲对后缀自动机的理解:

后缀自动机就是后缀树倒过来的样子,很形象. 

如ACADD:

其构造的思想大致是:

1.首先将点分为一些类别,其中有一些是接受点,也就是说走到接受点的都是原串的后缀,而接受点不止一个,所有的接受点就组成了所有后缀的集合.

2.当新加入一个字母c,那么原串的结尾就会产生变化,也就是说接受点要发生改变,我们就要想办法将当前的接受点的集合转移成新的集合,因为后缀自动机要保证状态数最小化,所以我们要尽量利用以前的状态来产生新的状态,所以当他的父亲节点含有c这个转移时,我们就直接讨论能否直接利用即可,注意:这里的父亲是指接受点集合之间的关系,也就是说沿着父亲节点走依旧会是接受点.

 

他的构造处有一些难理解的地方,比如len[q]==len[p]+1 和 len[q]>len[p]+1的讨论

如此图中

 

如此图中,在构造第二个A时 起始p为C 然后跳到了root 构造A时由于len[q]==len[p]+1 (p为root,q为第一处的A)那么就直接把A接到C后面,因为这种情况下q的路径必然经过p,可以脑补一下.

另一种就是插入D时 len[q]>len[p]+1 的情况,可以简单的想想,如果直接把D接到q指针的D后面,那么DD这个后缀将无法走出

所以要新建一个D强行满足第一种情况,就可以满足条件了

 

按这个例子的理解:如果len[q]!=len[p]+1 那么p-q中间存在一条路径,且只有这条路径上的点可以直接到达D.那么就会漏掉一些后缀.

严格的理解:

因为我们的目标是做到状态的最小化,所以要尽量利用之前的状态,那么如果len[q]==len[p]+1,那么就可以直接利用.

如果len[q]>len[p]+1,一个状态接受的字符串的长度是连续的,那么p-q之间还存在其他更长的后缀,我们要保证在新的后缀建立的情况下,原来的状态不能丢失,所以要新建节点,产生两个分支,这也是要把q复制到新节点上的原因,q能走到的地方,新节点都能走到,此时q的作用就是接受之前更长的子串.

 

重要性质:

1.设当前点为p,那么fa[p]是以p结尾的字符串的集合的最大子集,且不重复(根据构建方法可以脑补)

2.每一个节点内代表的字符串的长度是一段连续的区间[minlen,maxlen],且 maxlen[fa]+1=minlen

利用这个性质就可以解决这题,可以在parent树上直接dp,fa[p]存在的串,p也一定存在,那么就可以直接累加了

 

 1 #include <algorithm>
 2 #include <iostream>
 3 #include <cstdlib>
 4 #include <cstring>
 5 #include <cstdio>
 6 #include <cmath>
 7 using namespace std;
 8 typedef long long ll;
 9 const int N=1e6+5,M=2e6+10;
10 char s[N];int cur=1,cnt=1,n,last,ch[M][27],fa[M],dis[M],size[M];ll ans=0;
11 void build(int c,int id){
12     last=cur;cur=++cnt;
13     int p=last;dis[cur]=id;
14     for(;p && !ch[p][c];p=fa[p])ch[p][c]=cur;
15     if(!p)fa[cur]=1;
16     else{
17         int q=ch[p][c];
18         if(dis[q]==dis[p]+1)fa[cur]=q;
19         else{
20             int nt=++cnt;dis[nt]=dis[p]+1;
21             memcpy(ch[nt],ch[q],sizeof(ch[q]));
22             fa[nt]=fa[q];fa[q]=fa[cur]=nt;
23             for(;ch[p][c]==q;p=fa[p])ch[p][c]=nt;
24         }
25     }
26     size[cur]=1;
27 }
28 int c[N],sa[M];
29 void flower(){
30     for(int i=1;i<=cnt;i++)c[dis[i]]++;
31     for(int i=1;i<=n;i++)c[i]+=c[i-1];
32     for(int i=cnt;i>=1;i--)sa[c[dis[i]]--]=i;
33     for(int i=cnt;i;i--){
34         int p=sa[i];
35         if(size[p]>1)ans=max(ans,(ll)size[p]*dis[p]);
36         size[fa[p]]+=size[p];
37     }
38 }
39 void work(){
40     scanf("%s",s+1);n=strlen(s+1);
41     for(int i=1;i<=n;i++)build(s[i]-'a',i);
42     flower();
43     printf("%lld\n",ans);
44 }
45 int main()
46 {
47     work();
48     return 0;
49 }

 

posted @ 2017-08-01 11:19  PIPIBoss  阅读(6471)  评论(1编辑  收藏  举报