BZOJ2434[Noi2011]阿狸的打字机——AC自动机+dfs序+树状数组

题目描述

 阿狸喜欢收藏各种稀奇古怪的东西,最近他淘到一台老式的打字机。打字机上只有28个按键,分别印有26个小写英文字母和'B'、'P'两个字母。

经阿狸研究发现,这个打字机是这样工作的:

l 输入小写字母,打字机的一个凹槽中会加入这个字母(这个字母加在凹槽的最后)。

l 按一下印有'B'的按键,打字机凹槽中最后一个字母会消失。

l 按一下印有'P'的按键,打字机会在纸上打印出凹槽中现有的所有字母并换行,但凹槽中的字母不会消失。

例如,阿狸输入aPaPBbP,纸上被打印的字符如下:

a
aa
ab

我们把纸上打印出来的字符串从1开始顺序编号,一直到n。打字机有一个非常有趣的功能,在打字机中暗藏一个带数字的小键盘,在小键盘上输入两个数(x,y)(其中1≤x,y≤n),打字机会显示第x个打印的字符串在第y个打印的字符串中出现了多少次。

阿狸发现了这个功能以后很兴奋,他想写个程序完成同样的功能,你能帮助他么?

输入

 输入的第一行包含一个字符串,按阿狸的输入顺序给出所有阿狸输入的字符。

第二行包含一个整数m,表示询问个数。

接下来m行描述所有由小键盘输入的询问。其中第i行包含两个整数x, y,表示第i个询问为(x, y)。

输出

 输出m行,其中第i行包含一个整数,表示第i个询问的答案。

样例输入

aPaPBbP
3
1 2
1 3
2 3

样例输出

2
1
0

提示

 1<=N<=10^5

1<=M<=10^5

输入总长<=10^5
 
这是一道非常好的AC自动机的题(蒟蒻的我调了一下午QAQ),做完这道题相信你能对AC自动机有更深入的理解。
首先讲解几个前置知识点:
1、fail树:trie树上每个节点都有且只有一个失配标记,因此把每个节点和它的失配标记连上就形成了一棵树(这个不用解释了吧,只有一个失配标记相当于只有一个父亲qwq),我们一般称这棵树为fail树。
2、dfs序:这个大家应该都知道,但为了防止有人不知道还是说一下。dfs序就是dfs搜索到的点的顺序,在dfs序上一个点的子树上的所有点都是连着的且都在这个点的后面,也就是每个点的子树在dfs序上都是一段区间。
每次操作是询问X串在Y串中出现几次,也就是询问Y串上有几个节点的失配标记直接或间接指向X串的终止节点。
有了fail树也就把问题转化成了Y串上有多少个节点在以X串终止节点为根的子树上。
这道题做法比较麻烦,因此分步来讲解。
1、首先是读入的一个字符串,起初我打算模拟栈操作在每次P(打印)时把当前的栈所对应的串插入trie树,但这样每次在trie树上插入字符串都要从根节点重新走,显然时间复杂度是不行的。所以要直接把读入字符串插入到trie树上,当遇到B就回退一个节点,遇到P就给当前节点打一个终止标记,这样O(串长)就能建出trie树。
2、找每个节点失配标记并建立fail树。
3、做fail树的dfs序并维护每个节点子树区间的左右端点。
4、读入每个查询并挂链(查询比较多)。
5、对AC自动机dfs,每到一个节点把这个节点的权值+1,回溯到这个节点把这个点权值-1,(这样就保证只有当前dfs到的链上的点是有值的),当搜索到一个终止节点时,对它所有挂链进行进行查询,对于它的一个查询的X串,只要在dfs序上把这个X串终止节点的子树区间用树状数组(线段树也行)求和就行了。但要注意的是,不能真的做回溯dfs,因为这样会死循环,所以直接按节点编号来循环即可。
最后附上代码(数组含义在代码里写明)。
#include<cmath>
#include<queue>
#include<vector>
#include<cstdio>
#include<cstring>
#include<cstdlib>
#include<iostream>
#include<algorithm>
using namespace std;
queue<int>q;
int m;
int x,y;
int cnt;
int tot;
int num;
int len;
int cont;
int l[100010];//dfs序上每个数的子树对应区间的左端点
int r[100010];//dfs序上每个数的子树对应区间的右端点
int t[100010];//树状数组
int f[100010];//每个串的终止节点
char s[100010];//读入字符串
int to[100010];
int fa[100010];//trie树上每个点的父亲
int ans[100010];//答案
int val[100010];
int fail[100010];//失配指针
int next[100010];
int head[100010];
int a[100010][26];
void add(int x,int y,int v)
{
    tot++;
    next[tot]=head[x];
    head[x]=tot;
    to[tot]=y;
    val[tot]=v;
}
int ask(int x)
{
    int res=0;
    for(int i=x;i;i-=i&-i)
    {
        res+=t[i];
    }
    return res;
}
void change(int x,int v)
{
    for(int i=x;i<=num;i+=i&-i)
    {
        t[i]+=v;
    }
}
void build(char *s)//建立trie树
{
    int now=0;
    for(int i=0;i<len;i++)
    {
        if(s[i]=='B')
        {
            now=fa[now];
        }
        else if(s[i]=='P')
        {
            f[++cont]=now;
        }
        else
        {
            a[now][s[i]-'a']=++cnt;
            fa[cnt]=now;
            now=a[now][s[i]-'a'];
        }
    }
}
void getfail()//找每个点失配标记
{
    q.push(0);
    while(!q.empty())
    {
        int now=q.front();
        q.pop();
        if(now!=0)
        {
            add(fail[now],now,0);
        }
        for(int i=0;i<26;i++)
        {
            if(a[now][i]!=0)
            {
                q.push(a[now][i]);
                if(now!=0)
                {
                    fail[a[now][i]]=a[fail[now]][i];
                }
                else
                {
                    fail[a[now][i]]=0;
                }
            }
            else
            {
                a[now][i]=a[fail[now]][i];
            }
        }
    }
}
void dfs(int x)//找fail树的dfs序
{
    l[x]=++num;
    for(int i=head[x];i;i=next[i])
    {
        dfs(to[i]);
    }
    r[x]=num;
}
int main()
{
    scanf("%s",&s);
    len=strlen(s);
    build(s);
    getfail();
    dfs(0);
    scanf("%d",&m);
    tot=0;
    memset(head,0,sizeof(head));
    for(int i=1;i<=m;i++)
    {
        scanf("%d%d",&x,&y);
        add(y,x,i);
    }
    int now=0;
    cont=0;
    for(int i=0;i<len;i++)
    {
        if(s[i]-'a'==-31)
        {
            change(l[now],-1);
            now=fa[now];
        }
        else if(s[i]-'a'==-17)
        {
            for(int j=head[++cont];j;j=next[j])
            {
                ans[val[j]]=ask(r[f[to[j]]])-ask(l[f[to[j]]]-1);
            }
        }
        else
        {
            now=a[now][s[i]-'a'];
            change(l[now],1);
        }
    }
    for(int i=1;i<=m;i++)
    {
        printf("%d\n",ans[i]);
    }
}
posted @ 2018-06-08 16:54  The_Virtuoso  阅读(541)  评论(2编辑  收藏  举报