kmp算法
#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;
char s1[1000002],s2[1000003];
int kmp[1000002];
int len1,len2,j;
int main(){
cin>>s1+1;
cin>>s2+1;
len1=strlen(s1+1);
len2=strlen(s2+1);
for(int i=2;i<=len2;i++){
while(j>0&&s2[i]!=s2[j+1])
j=kmp[j];
if(s2[i]==s2[j+1])
j++;
kmp[i]=j;
}
j=0;
for(int i=1;i<=len1;i++){
while(j>0&&s1[i]!=s2[j+1])
j=kmp[j];
if(s2[j+1]==s1[i])
j++;
if(j==len2){
printf("%d\n",i-len2+1);
j=kmp[j];
}
}
for(int i=1;i<=len2;i++){
printf("%d ",kmp[i]);
}
return 0;
}
这个,真的是啊,emmmmm,可能是我太笨了吧,看了半天勉强懂了一点点。
大体的(具体的)思想小姐姐的博客里有讲的很详细啦,这里就不再写了(其实是偷懒
但是有一个地方就是子串的自我匹配我一直都不懂,找了好久发现很多人都是一笔带过没有仔细说(或许是因为太简单了
j==0时是指的已经出边界了,因为kmp数组有为0的所以要提一下,
j其实相当于一个分界线
如aabaabc
i=2,j=0 while跳过,if成立,j->1,kmp【2】=1;
i=3,j=1 while成立 {j->0} if不成立,kmp【3】=0;
i=4,j=0 while跳过,if成立,j->1,kmp【4】=1;
i=5,j=1 while跳过,if成立,j->2,kmp【5】=2;
i=6,j=2 while跳过,if成立,j->3,kmp【6】=3;
i=7,j=3 while成立{j=kmp【3】=0},if不成立,kmp【7】=0;
可以看出,j为前缀,i为以i为结束的子串。如果kmp【i-1】!=0,说明从i-1往前的kmp【i-1】个已经与从头往后的j个合上了(因为j一直记录最新一个i从头往后的最大可匹配数),那么,第i个只需要与j+1个看看能不能合上,如果可以就愉快的继续下一个i了(如i=5时就是从i=4时继承过来的),
不可以的话,这个例子不好,我们再举一个例子
ABCDABCDABCE
现在我们来求 E 的kmp值
ABCDABCDABCE q1
ABCDABCDABCE q2
求 E 时,j=6了已经,但j+1与i为E不匹配,这时肉眼可见我们应该从ABC开始找
ABCDABCDABCE q3
ABCDABCDABCE q4
kmp【12】<7,此时往前找最大可能(此时还未将此可能证实是否可行,即未实现j+1与i的if匹配)
求从i-1往前和从1往后的最大前后缀重合,别忘了此时q1与q2已经重合并且=7-1,那不就是求kmp【j】么。
接下来相似,一轮一轮往前翻就好了。
另:这个做法的确不好理解,建议换一种写法
给个好理解的dalao的博客

浙公网安备 33010602011771号