[NOI2018]你的名字(68pts) 后缀自动机
题目描述
小A 被选为了ION2018 的出题人,他精心准备了一道质量十分高的题目,且已经把除了题目命名以外的工作都做好了。
由于ION 已经举办了很多届,所以在题目命名上也是有规定的,ION 命题手册规定:每年由命题委员会规定一个小写字母字符串,我们称之为那一年的命名串,要求每道题的名字必须是那一年的命名串的一个非空连续子串,且不能和前一年的任何一道题目的名字相同。
由于一些特殊的原因,小A 不知道ION2017 每道题的名字,但是他通过一些特殊手段得到了ION2017 的命名串,现在小A 有Q 次询问:每次给定ION2017 的命名串和ION2018 的命名串,求有几种题目的命名,使得这个名字一定满足命题委员会的规定,即是ION2018 的命名串的一个非空连续子串且一定不会和ION2017 的任何一道题目的名字相同。
由于一些特殊原因,所有询问给出的ION2017 的命名串都是某个串的连续子串,详细可见输入格式。
题解:68 $pts$ 做法:
令 $mx[i]$ 表示 $T$ 中 $[1...i]$ 中与 $S$ 最长匹配长度且为 $[1...i]$ 中后缀
如果不考虑重复,则 $ans=\sum i-mx[i]$
将同一个子串算作一个,我们对 $T$ 也构建后缀自动机
插入当前字符 $arr[i]$ 后自动机末尾节点为 $np$,那么对于 $mx[i]$ 有两种情况
#1. $mx[i]\in(len[f_{np}], len[np]]$ 那么这一部分就由 $np$ 贡献
#2. $mx[i]\in[1,len[f_{np}]]$ 那么这一部分就由 $f_{np}$ 贡献
一定要注意,这里是一边插入字符一边建立 $T$ 的 $SAM$ 的,所以如果对 $np$贡献
那么后缀树中 $np$ 祖先中所有节点在建出时都是可以与 $S$ 进行完全匹配的 !!
所以他的祖先都是一点都不贡献的 !!!!!
只会贡献那个极长的后缀,所以这个做法就是对的
最后,答案即为 $\sum_{i=1}^{tot}max(0,len[i]-max(mx[pos_{i}],len[f_{i}])$
Code:
#include <cstdio>
#include <algorithm>
#include <cstring>
#define setIO(s) freopen(s".in","r",stdin)
#define maxn 3000008
#define ll long long
#define N 30
using namespace std;
int pos[maxn],n,queries,mx[maxn];
char str[maxn],ss[maxn];
namespace SAM1{
int last,tot,dis[maxn],ch[maxn][N],f[maxn];
void init() { last=tot=1; }
void ins(int c){
int p=last,np=++tot; last=np; dis[np]=dis[p]+1;
while(p&&!ch[p][c])ch[p][c]=np,p=f[p];
if(!p) f[np]=1;
else{
int q=ch[p][c],nq;
if(dis[q]==dis[p]+1) f[np]=q;
else{
nq=++tot;
dis[nq]=dis[p]+1;
memcpy(ch[nq],ch[q],sizeof(ch[q]));
f[nq]=f[q],f[q]=f[np]=nq;
while(p&&ch[p][c]==q) ch[p][c]=nq,p=f[p];
}
}
}
void solve(){
int nn=strlen(ss),p=1,cnt=0;
for(int i=0;i<nn;++i) {
while(p&&!ch[p][ss[i]-'a']) p=f[p],cnt=dis[p];
if(!p) {p=1;cnt=0; }
else ++cnt,p=ch[p][ss[i]-'a'];
mx[i+1]=cnt;
}
}
};
namespace SAM2{
int last,tot,dis[maxn],ch[maxn][N],f[maxn];
void init(){last=++tot; }
void ins(int c,int y,int rt){
int p=last,np=++tot; last=np; dis[np]=dis[p]+1; pos[np]=y;
while(p&&!ch[p][c])ch[p][c]=np,p=f[p];
if(!p) f[np]=rt;
else{
int q=ch[p][c],nq;
if(dis[q]==dis[p]+1) f[np]=q;
else{
nq=++tot;
dis[nq]=dis[p]+1;
pos[nq]=pos[q];
memcpy(ch[nq],ch[q],sizeof(ch[q]));
f[nq]=f[q],f[q]=f[np]=nq;
while(p&&ch[p][c]==q) ch[p][c]=nq,p=f[p];
}
}
}
ll solve(int l){
ll sum=0;
for(int i=l+1;i<=tot;++i)
sum+=max(0,dis[i]-max(dis[f[i]],mx[pos[i]]));
return sum;
}
};
int main(){
//setIO("input");
scanf("%s",str),n=strlen(str),SAM1::init();
for(int i=0;i<n;++i) SAM1::ins(str[i]-'a');
scanf("%d",&queries);
while(queries--){
SAM2::init();
int rt=SAM2::tot,l,r,nn;
scanf("%s%d%d",ss,&l,&r),nn=strlen(ss);
for(int i=0;i<nn;++i) SAM2::ins(ss[i]-'a',i+1,rt);
SAM1::solve();
printf("%lld\n",SAM2::solve(rt));
}
return 0;
}

浙公网安备 33010602011771号