AC自动机的应用(建fail树)

 


做完阿狸的打字机和 Mike and Friends 后,对AC自动机有了更深的理解, 也初步掌握了建立 fail树的方法和用途,来总结一下。

什么时候会用到 fail 树呢, 在多次查询一个串在另一个串中的出现次数时建 fail 树可以大大缩短时间复杂度。

将每个 fail 看作是一条反向边, 那么所有 fail 连起来的边就是一棵树, 在这棵树中, 对于一个字串 x 在字串 y 中出现的次数,只需要找到字串 x 的结束点的子树中有几个点是 字串外跳 fail 能达到的节点即可。

考虑为什么是这样,首先 每一条 fail 边相连的一定是该串的字串,所以 x 的子树中每个点的 fail 都会出现 x的结束点, 即出现整个 x 字串, 那么只要找到其中属于 y 的就是答案了。

接下来考虑如何快速寻找这样的点,我们可以先把这棵新建好的 fail 树求一边 dfs序, 这样一来子树中的编号就是连续的, 对于一段连续的序列可以用树状数组维护前缀和,如此就可以快速求出答案。


------------

#### 上例题


------------


# P2414 [NOI2011] 阿狸的打字机


# [NOI2011] 阿狸的打字机

## 题目描述

阿狸喜欢收藏各种稀奇古怪的东西,最近他淘到一台老式的打字机。打字机上只有 $28$ 个按键,分别印有 $26$ 个小写英文字母和 `B`、`P` 两个字母。经阿狸研究发现,这个打字机是这样工作的:

* 输入小写字母,打字机的一个凹槽中会加入这个字母(这个字母加在凹槽的最后)。
* 按一下印有 `B` 的按键,打字机凹槽中最后一个字母会消失。
* 按一下印有 `P` 的按键,打字机会在纸上打印出凹槽中现有的所有字母并换行,但凹槽中的字母不会消失。

例如,阿狸输入 `aPaPBbP`,纸上被打印的字符如下:

```
a
aa
ab
```

我们把纸上打印出来的字符串从 $1$ 开始顺序编号,一直到 $n$。打字机有一个非常有趣的功能,在打字机中暗藏一个带数字的小键盘,在小键盘上输入两个数 $(x,y)$(其中 $1\leq x,y\leq n$),打字机会显示第 $x$ 个打印的字符串在第 $y$ 个打印的字符串中出现了多少次。

阿狸发现了这个功能以后很兴奋,他想写个程序完成同样的功能,你能帮助他么?

## 输入格式

输入的第一行包含一个字符串,按阿狸的输入顺序给出所有阿狸输入的字符。

第二行包含一个整数 $m$,表示询问个数。

接下来 $m$ 行描述所有由小键盘输入的询问。其中第 $i$ 行包含两个整数 $x, y$,表示第 $i$ 个询问为 $(x, y)$。

## 输出格式

输出 $m$ 行,其中第 $i$ 行包含一个整数,表示第 $i$ 个询问的答案。

## 样例 #1

### 样例输入 #1

```
aPaPBbP
3
1 2
1 3
2 3
```

### 样例输出 #1

```
2
1
0
```

## 提示

### 数据范围

对于 $100\%$ 的数据,$1\leq n\leq 10^5$,$1\leq m\leq10^5$,第一行总长度 $\leq 10^5$。

|测试点|$n$ 的规模|$m$ 的规模|字符串长度|第一行长度|
|:-:|:-:|:-:|:-:|:-:|
|$1,2$|$1\leq n\leq 100$|$1\leq m\leq 10^3$| - |$\leq 100$|
|$3,4$|$1\leq n\leq 10^3$|$1\leq m\leq 10^4$|单个长度 $\leq 10^3$,总长度 $\leq 10^5$|$\leq 10^5$|
|$5\sim 7$|$1\leq n\leq 10^4$|$1\leq m\leq 10^5$|总长度 $\leq 10^5$|$\leq 10^5$|
|$8\sim 10$|$1\leq n\leq 10^5$|$1\leq m\leq 10^5$| - |$\leq 10^5$|

 

 

 

 


------------
题目的意思很显然,求 x 在 y 中出现的次数,跟上面说的方法一样, 只需要建 fail树, 把询问离线下来,从小到大用树状数组维护即可。

#include<iostream>
#include<cstdio>
#include<cstring>
#include<queue>
#include<algorithm>
using namespace std;
const int N = 1e5 + 5;
int num, cnt, dfn[N], out[N], ans[N];
int sum[N], s[N], head[N], tot, top = -1;
char c[N];
struct dp{
int next, to;
}edge[N<<2];
struct node{
int fail, vis[26], end, ans;
int fa;
}AC[N];
struct dp2{
int x, y, id;
inline bool operator <(const dp2 &f) const{
return y < f.y;
}
}a[N];
void add(int u, int v){
tot++;
edge[tot].next = head[u];
edge[tot].to = v;
head[u] = tot;
}
void jia(int x, int w){
for(; x <= cnt; x += x & -x) sum[x] += w;
}
int ask(int x){
int res = 0;
for(; x > 0; x -= x & -x) res += sum[x];
return res;
}
void dfs(int u, int fa){
dfn[u] = ++top;
for(int i = head[u]; i; i = edge[i].next){
int v = edge[i].to;
if(v == fa) continue;
dfs(v, u);
}
out[u] = top;
}
void get(){
queue<int> q;
for(int i = 0; i < 26; i++){
int v = AC[0].vis[i];
if(v){
AC[v].fail = 0;
q.push(v);
}
}
while(!q.empty()){
int u = q.front();
q.pop();
for(int i = 0; i < 26; i++){
int v = AC[u].vis[i];
if(v){
AC[v].fail = AC[AC[u].fail].vis[i];
q.push(v);
}else AC[u].vis[i] = AC[AC[u].fail].vis[i];
}
}
for(int i = 1; i <= cnt; i++) add(AC[i].fail, i);
dfs(0, 0);
}
int main(){
scanf("%s", c);
int l = strlen(c), now = 0;
for(int i = 0; i < l; i++){
if(c[i] == 'P') {
s[++num] = now, AC[now].end = num;
}else if(c[i] == 'B') now = AC[now].fa;
else {
if(!AC[now].vis[c[i] - 'a'])
AC[now].vis[c[i] - 'a'] = ++cnt, AC[cnt].fa = now;
now = AC[now].vis[c[i] - 'a'];
}
}
get();
int m;
scanf("%d", &m);
for(int i = 1; i <= m; i++){
scanf("%d%d", &a[i].x, &a[i].y);
a[i].id = i;
}
sort(a + 1, a + 1 + m);
int k = 0, f = 1;
now = 0;
for(int i = 0; i < l; i++){
if(c[i] >= 'a' && c[i] <= 'z'){
now = AC[now].vis[c[i] - 'a'];
jia(dfn[now], 1);
}else if(c[i] == 'P'){
k++;
//cout << i << " " << k << endl;
for(int j = f; a[j].y == k; j++){
ans[a[j].id] += ask(out[s[a[j].x]]) - ask(dfn[s[a[j].x]] - 1);
f = j;
}
if(a[f].y == k) f++;
}else {
jia(dfn[now], -1);
now = AC[now].fa;
}
}
for(int i = 1; i <= m; i++) printf("%d\n", ans[i]);
return 0;
}

 

posted @ 2022-07-15 16:48  strange757  阅读(110)  评论(0)    收藏  举报