KMP板子+Trie板子

KMP算法是一个字符串匹配算法,最直白的用法就是在一个长度为n的字符串T中查找另一个长度为m字符串P的匹配(总之就是用于文本中进行单个字符串的匹配)。

对于这个问题,暴力算法是很好做的,直接对于T的每个位置判断一下当前位置作为P的结尾是否可以匹配成功,算法复杂度是O(nm)。

KMP算法的主要思想是:假设现在正在用P的第j个字符和T的第i个字符进行匹配,如果成功就匹配下一个字符;如果失败的话就跳到 以j-1个字符为结尾的后缀的 最长相同前缀的结尾 后一个位置进行匹配。为此要把P做成一个状态机(也就是失配函数),在上面根据情况进行转移。

复杂分析:每一次i增加的时候伴随着j的增加,i增加的时候为j提供了减少的空间,因此j最多会减少n次。加上预处理的时间,总时间复杂度O(n+m)。(这次一定要好好记住,之前看一次忘一次。。。)

下面给出上面问题的代码(n<=1000000,m<=10000)。

 

 1 #include<iostream>
 2 #include<cstdio>
 3 #include<cstring>
 4 #include<cstdlib>
 5 #include<algorithm>
 6 #include<cmath>
 7 #include<queue>
 8 #include<set>
 9 #include<map>
10 #include<vector>
11 #include<cctype>
12 using namespace std;
13 const int maxn=1000005;
14 const int maxm=10005;
15 
16 int N,f[maxn];
17 char P[maxm],T[maxn];
18 
19 void getfail(char *p)
20 {
21     f[0]=f[1]=0;
22     int m=strlen(p);
23     for(int i=1;i<m;i++){
24         int j=f[i];
25         while(j&&p[i]!=p[j]) j=f[j];
26         f[i+1]=p[i]==p[j]?j+1:0;
27     }
28 }
29 int find(char *t,char *p)
30 {
31     getfail(p);
32     int j=0,re=0,m=strlen(p),n=strlen(t);
33     for(int i=0;i<n;i++){
34         while(j&&t[i]!=p[j]) j=f[j];
35         if(t[i]==p[j]) j++;
36         if(j==m) re++,j=f[j];
37     }
38     return re;
39 }
40 int main()
41 {
42     scanf("%d\n",&N);
43     for(int i=1;i<=N;i++){
44         gets(P);gets(T);
45         printf("%d\n",find(T,P));
46     }
47     return 0;
48 }

 

 

Trie是一种可以让你欢快的在字典中查找单词的数据结构,所以单次查询时间复杂度为什么是O(1)。。。。。。

下面的代码是这样一个问题:给出一个长字符串和一些字典中的单词,问用这些单词拼接出长字符串的方案数mod20071027答案是多少,单词可以重复使用。倒着插入所有字典之后dp就可以了。

 

 1 #include<iostream>
 2 #include<cstdio>
 3 #include<cstring>
 4 #include<cstdlib>
 5 #include<algorithm>
 6 #include<cmath>
 7 #include<queue>
 8 #include<set>
 9 #include<map>
10 #include<vector>
11 #include<cctype>
12 using namespace std;
13 const int maxn=1000005;
14 const int maxm=105;
15 const int mo=20071027;
16 
17 int N,f[maxn];
18 char T[maxn],S[maxm];
19 struct Trie{
20     static const int maxnd=4000005;
21     static const int sigma_size=26;
22     int np,ch[maxnd][sigma_size],val[maxnd];
23     Trie(){ np=0,val[0]=0; memset(ch[0],0,sizeof(ch[0])); }
24     void insert(char *s)
25     {
26         int now=0,i=strlen(s)-1;
27         while(i>=0){
28             if(!ch[now][s[i]-'a']){
29                 ch[now][s[i]-'a']=++np;
30                 memset(ch[np],0,sizeof(ch[np]));
31                 val[np]=0;
32             }
33             now=ch[now][s[i--]-'a'];
34         }
35         val[now]++;
36     }
37     int find(int i)
38     {
39         int now=0,re=0;
40         while(i>0){
41             if(!ch[now][T[i]-'a']) break;
42             now=ch[now][T[i--]-'a'];
43             if(val[now]) re=(re+f[i])%mo;
44         }
45         if(!i&&val[ch[now][T[i]-'a']]) re=(re+1)%mo;
46         return re;
47     }
48 }trie;
49 
50 void data_in()
51 {
52     gets(T); scanf("%d\n",&N);
53     for(int i=1;i<=N;i++){
54         gets(S);
55         trie.insert(S);
56     }
57 }
58 void work()
59 {
60     int n=strlen(T);
61     for(int i=0;i<n;i++) f[i]=trie.find(i);
62     printf("%d\n",f[n-1]);
63 }
64 int main()
65 {
66     data_in();
67     work();
68     return 0;
69 }

 

posted @ 2018-03-03 21:52  KKKorange  阅读(297)  评论(0编辑  收藏  举报