kmp算法

#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;

char s1[1000002],s2[1000003];
int kmp[1000002];
int len1,len2,j;

int main(){
	cin>>s1+1;
	cin>>s2+1;
	len1=strlen(s1+1);
	len2=strlen(s2+1);
	for(int i=2;i<=len2;i++){
		while(j>0&&s2[i]!=s2[j+1])
			j=kmp[j];
		if(s2[i]==s2[j+1])
			j++;
		kmp[i]=j;
	}
	j=0;
	for(int i=1;i<=len1;i++){
		while(j>0&&s1[i]!=s2[j+1])
			j=kmp[j];
		if(s2[j+1]==s1[i])
			j++;
		if(j==len2){
			printf("%d\n",i-len2+1);
			j=kmp[j];
		}
	}
	for(int i=1;i<=len2;i++){
		printf("%d ",kmp[i]);
	}
	return 0;
}

这个，真的是啊，emmmmm，可能是我太笨了吧，看了半天勉强懂了一点点。

大体的（具体的）思想小姐姐的博客里有讲的很详细啦，这里就不再写了（其实是偷懒

dalao的博客

但是有一个地方就是子串的自我匹配我一直都不懂，找了好久发现很多人都是一笔带过没有仔细说（或许是因为太简单了

j==0时是指的已经出边界了，因为kmp数组有为0的所以要提一下，

j其实相当于一个分界线

如aabaabc

i=2，j=0 while跳过，if成立，j->1，kmp【2】=1；

i=3，j=1 while成立 {j->0} if不成立，kmp【3】=0；

i=4，j=0 while跳过，if成立，j->1，kmp【4】=1；

i=5，j=1 while跳过，if成立，j->2，kmp【5】=2；

i=6，j=2 while跳过，if成立，j->3，kmp【6】=3；

i=7，j=3 while成立{j=kmp【3】=0}，if不成立，kmp【7】=0；

可以看出，j为前缀，i为以i为结束的子串。如果kmp【i-1】！=0，说明从i-1往前的kmp【i-1】个已经与从头往后的j个合上了（因为j一直记录最新一个i从头往后的最大可匹配数），那么，第i个只需要与j+1个看看能不能合上，如果可以就愉快的继续下一个i了（如i=5时就是从i=4时继承过来的），

不可以的话，这个例子不好，我们再举一个例子

ABCDABCDABCE

现在我们来求 E 的kmp值

ABCDABCDABCE q1

ABCDABCDABCE q2

求 E 时，j=6了已经，但j+1与i为E不匹配，这时肉眼可见我们应该从ABC开始找

ABCDABCDABCE q3

ABCDABCDABCE q4

kmp【12】<7，此时往前找最大可能（此时还未将此可能证实是否可行，即未实现j+1与i的if匹配）

求从i-1往前和从1往后的最大前后缀重合，别忘了此时q1与q2已经重合并且=7-1，那不就是求kmp【j】么。

接下来相似，一轮一轮往前翻就好了。

另：这个做法的确不好理解，建议换一种写法

给个好理解的dalao的博客

posted @ 2019-06-23 20:57 sdzmq 阅读(168) 评论(0) 收藏举报

刷新页面返回顶部

sdzmq

kmp算法

公告