AC自动机的应用(建fail树)
做完阿狸的打字机和 Mike and Friends 后,对AC自动机有了更深的理解, 也初步掌握了建立 fail树的方法和用途,来总结一下。
什么时候会用到 fail 树呢, 在多次查询一个串在另一个串中的出现次数时建 fail 树可以大大缩短时间复杂度。
将每个 fail 看作是一条反向边, 那么所有 fail 连起来的边就是一棵树, 在这棵树中, 对于一个字串 x 在字串 y 中出现的次数,只需要找到字串 x 的结束点的子树中有几个点是 字串外跳 fail 能达到的节点即可。
考虑为什么是这样,首先 每一条 fail 边相连的一定是该串的字串,所以 x 的子树中每个点的 fail 都会出现 x的结束点, 即出现整个 x 字串, 那么只要找到其中属于 y 的就是答案了。
接下来考虑如何快速寻找这样的点,我们可以先把这棵新建好的 fail 树求一边 dfs序, 这样一来子树中的编号就是连续的, 对于一段连续的序列可以用树状数组维护前缀和,如此就可以快速求出答案。
------------
#### 上例题
------------
# P2414 [NOI2011] 阿狸的打字机
# [NOI2011] 阿狸的打字机
## 题目描述
阿狸喜欢收藏各种稀奇古怪的东西,最近他淘到一台老式的打字机。打字机上只有 $28$ 个按键,分别印有 $26$ 个小写英文字母和 `B`、`P` 两个字母。经阿狸研究发现,这个打字机是这样工作的:
* 输入小写字母,打字机的一个凹槽中会加入这个字母(这个字母加在凹槽的最后)。
* 按一下印有 `B` 的按键,打字机凹槽中最后一个字母会消失。
* 按一下印有 `P` 的按键,打字机会在纸上打印出凹槽中现有的所有字母并换行,但凹槽中的字母不会消失。
例如,阿狸输入 `aPaPBbP`,纸上被打印的字符如下:
```
a
aa
ab
```
我们把纸上打印出来的字符串从 $1$ 开始顺序编号,一直到 $n$。打字机有一个非常有趣的功能,在打字机中暗藏一个带数字的小键盘,在小键盘上输入两个数 $(x,y)$(其中 $1\leq x,y\leq n$),打字机会显示第 $x$ 个打印的字符串在第 $y$ 个打印的字符串中出现了多少次。
阿狸发现了这个功能以后很兴奋,他想写个程序完成同样的功能,你能帮助他么?
## 输入格式
输入的第一行包含一个字符串,按阿狸的输入顺序给出所有阿狸输入的字符。
第二行包含一个整数 $m$,表示询问个数。
接下来 $m$ 行描述所有由小键盘输入的询问。其中第 $i$ 行包含两个整数 $x, y$,表示第 $i$ 个询问为 $(x, y)$。
## 输出格式
输出 $m$ 行,其中第 $i$ 行包含一个整数,表示第 $i$ 个询问的答案。
## 样例 #1
### 样例输入 #1
```
aPaPBbP
3
1 2
1 3
2 3
```
### 样例输出 #1
```
2
1
0
```
## 提示
### 数据范围
对于 $100\%$ 的数据,$1\leq n\leq 10^5$,$1\leq m\leq10^5$,第一行总长度 $\leq 10^5$。
|测试点|$n$ 的规模|$m$ 的规模|字符串长度|第一行长度|
|:-:|:-:|:-:|:-:|:-:|
|$1,2$|$1\leq n\leq 100$|$1\leq m\leq 10^3$| - |$\leq 100$|
|$3,4$|$1\leq n\leq 10^3$|$1\leq m\leq 10^4$|单个长度 $\leq 10^3$,总长度 $\leq 10^5$|$\leq 10^5$|
|$5\sim 7$|$1\leq n\leq 10^4$|$1\leq m\leq 10^5$|总长度 $\leq 10^5$|$\leq 10^5$|
|$8\sim 10$|$1\leq n\leq 10^5$|$1\leq m\leq 10^5$| - |$\leq 10^5$|
------------
题目的意思很显然,求 x 在 y 中出现的次数,跟上面说的方法一样, 只需要建 fail树, 把询问离线下来,从小到大用树状数组维护即可。
#include<iostream> #include<cstdio> #include<cstring> #include<queue> #include<algorithm> using namespace std; const int N = 1e5 + 5; int num, cnt, dfn[N], out[N], ans[N]; int sum[N], s[N], head[N], tot, top = -1; char c[N]; struct dp{ int next, to; }edge[N<<2]; struct node{ int fail, vis[26], end, ans; int fa; }AC[N]; struct dp2{ int x, y, id; inline bool operator <(const dp2 &f) const{ return y < f.y; } }a[N]; void add(int u, int v){ tot++; edge[tot].next = head[u]; edge[tot].to = v; head[u] = tot; } void jia(int x, int w){ for(; x <= cnt; x += x & -x) sum[x] += w; } int ask(int x){ int res = 0; for(; x > 0; x -= x & -x) res += sum[x]; return res; } void dfs(int u, int fa){ dfn[u] = ++top; for(int i = head[u]; i; i = edge[i].next){ int v = edge[i].to; if(v == fa) continue; dfs(v, u); } out[u] = top; } void get(){ queue<int> q; for(int i = 0; i < 26; i++){ int v = AC[0].vis[i]; if(v){ AC[v].fail = 0; q.push(v); } } while(!q.empty()){ int u = q.front(); q.pop(); for(int i = 0; i < 26; i++){ int v = AC[u].vis[i]; if(v){ AC[v].fail = AC[AC[u].fail].vis[i]; q.push(v); }else AC[u].vis[i] = AC[AC[u].fail].vis[i]; } } for(int i = 1; i <= cnt; i++) add(AC[i].fail, i); dfs(0, 0); } int main(){ scanf("%s", c); int l = strlen(c), now = 0; for(int i = 0; i < l; i++){ if(c[i] == 'P') { s[++num] = now, AC[now].end = num; }else if(c[i] == 'B') now = AC[now].fa; else { if(!AC[now].vis[c[i] - 'a']) AC[now].vis[c[i] - 'a'] = ++cnt, AC[cnt].fa = now; now = AC[now].vis[c[i] - 'a']; } } get(); int m; scanf("%d", &m); for(int i = 1; i <= m; i++){ scanf("%d%d", &a[i].x, &a[i].y); a[i].id = i; } sort(a + 1, a + 1 + m); int k = 0, f = 1; now = 0; for(int i = 0; i < l; i++){ if(c[i] >= 'a' && c[i] <= 'z'){ now = AC[now].vis[c[i] - 'a']; jia(dfn[now], 1); }else if(c[i] == 'P'){ k++; //cout << i << " " << k << endl; for(int j = f; a[j].y == k; j++){ ans[a[j].id] += ask(out[s[a[j].x]]) - ask(dfn[s[a[j].x]] - 1); f = j; } if(a[f].y == k) f++; }else { jia(dfn[now], -1); now = AC[now].fa; } } for(int i = 1; i <= m; i++) printf("%d\n", ans[i]); return 0; }

浙公网安备 33010602011771号