ac自动机的理解
#其他博客讲得很正规透透的了,我想提供一点通俗易懂的菜鸡视角
ac自动机的起源我猜是:
对于字符串串abcde
枚举到abcd发现e不匹配后,再回去从b开始匹配吗?
如果能知道bcd是哪个目标串的前缀就好了,我们就可以换成这个目标串继续配
失配指针就是用来找这个目标串的
字典树:存she,sher,her,fresh,fish,fit时:

+=1表示多少字符串以这个作为结尾.懒狗,只写了俩;
失配指针就是当发现这条路径的儿子没有我们现在手上的字母时,我们想换模式串,的向导。
那句“让这个节点的失败指针指向(((他父亲节点)的失败指针所指向的那个节点)的下一个节点)”
翻译成人话就是,对于每点的失配指针,设该点值为i,指向的是字典树的另外某条路径上的i点,
且从根节点到指针指向的点连起来,为当前失配了的字符串的后缀,当该点失配后,跳过去还有希望配上。
为啥一定是后缀勒,这是算法保证的
找i点的失败指针时,首先找到它爸的失败指针,然后跳过去,再找找该点的儿子们有没有跟i值相同的,有的话就是它了,没有的话再跳到现在该点的失配指针
这就保证后缀了。
并且它爸的失败指针指向的是最长后缀(贪心)。
理解就到这里了----
实现部分:
抄的,模板题还没打,注释部分详解待填
#include<iostream> #include<cstdio> #include<cstdlib> #include<cstring> #include<cmath> #include<queue> #include<algorithm> using namespace std; struct Tree//字典树 { int fail;//失配指针 int vis[26];//子节点的位置 int end;//标记有几个单词以这个节点结尾 }AC[1000000];//Trie树 int cnt=0;//Trie的指针 inline void Build(string s) { int l=s.length(); int now=0;//字典树的当前指针 for(int i=0;i<l;++i)//构造Trie树 { if(AC[now].vis[s[i]-'a']==0)//Trie树没有这个子节点 AC[now].vis[s[i]-'a']=++cnt;//构造出来 now=AC[now].vis[s[i]-'a'];//向下构造 } AC[now].end+=1;//标记单词结尾 } void Get_fail()//构造fail指针 { queue<int> Q;//队列 for(int i=0;i<26;++i)//第二层的fail指针提前处理一下 { if(AC[0].vis[i]!=0) { AC[AC[0].vis[i]].fail=0;//指向根节点 Q.push(AC[0].vis[i]);//压入队列 } } while(!Q.empty())//BFS求fail指针 { int u=Q.front(); Q.pop(); for(int i=0;i<26;++i)//枚举所有子节点 { if(AC[u].vis[i]!=0)//存在这个子节点 { AC[AC[u].vis[i]].fail=AC[AC[u].fail].vis[i]; //子节点的fail指针指向当前节点的 //fail指针所指向的节点的相同子节点 Q.push(AC[u].vis[i]);//压入队列 } else//不存在这个子节点 AC[u].vis[i]=AC[AC[u].fail].vis[i]; //当前节点的这个子节点指向当 //前节点fail指针的这个子节点 } } } int AC_Query(string s)//AC自动机匹配 { int l=s.length(); int now=0,ans=0; for(int i=0;i<l;++i) { now=AC[now].vis[s[i]-'a'];//向下一层 for(int t=now;t&&AC[t].end!=-1;t=AC[t].fail)//循环求解 { ans+=AC[t].end; AC[t].end=-1; } } return ans; } int main() { int n; string s; cin>>n; for(int i=1;i<=n;++i) { cin>>s; Build(s); } AC[0].fail=0;//结束标志 Get_fail();//求出失配指针 cin>>s;//文本串 cout<<AC_Query(s)<<endl; return 0; }

浙公网安备 33010602011771号