KMP 学习笔记

何为KMP？

我们先考虑一个字符串匹配的问题

暴力求解

一个简单地方法是，在主串枚举每一个字符，与模式串一位一位的匹配，失配则从主串的下一个字符开始，与模式串的第一位匹配。

这样匹配时间复杂度显然是不过关的。

KMP 算法

暴力算法之所以低效，因为它对主串中每个字符进行了大量的重复的比较，而 KMP 算法可以很好地解决这个问题。

这里先引入一个概念：border

border‌是字符串的最长公共前后缀，在KMP算法中用于优化字符串匹配效率，通过预处理border信息可跳过无效匹配位置

例如 ababa 这个字符串，他的前缀是 a，ab，aba，abab。后缀是 a，ba，aba，baba。故该字符串的 border 为 aba。

注意，前缀和后缀的长度都不能和字符串等长，故 border 的长度也不能和字符串等长。

再引入一个概念：Next 表

\(Next\) 表是一个存储 border 的表，其中 \(Next_i\) 表示以 \(S_i\) 结尾的前缀的 border。

如何求border?

要想做到合理的时间复杂度，border必须要在 \(O(n)\) 的时间复杂度下求出来，否则 KMP 就会退化。

若前缀往后一位与前缀 border 往后一位不相同，则往前找 border 的 border，直到出现相同的，设这个值为 \(j\)

如果 \(S_i = S_j\)，则 \(Next_{i + 1} = j + 1\)

否则 \(next_{i + 1} = 0\)。

代码实现

void getNext(char *p, int plen) {
	Next[0] = 0, Next[1] = 0;
	for(int i = 1;i <= plen;i ++) {
		int j = Next[i];
		while(j && p[i] != p[j]) {
			j = Next[j];
		}
		if(p[i] == p[j]) {
			Next[i + 1] = j + 1;
		}
		else Next[i + 1] = 0;
	}
}

那么 KMP 的代码就很好写了

void kmp(char *s, char *p) {
	int last = -1;
	int slen = strlen(s), plen = strlen(p);
	getNext(p, plen);
	int j = 0;
	for(int i = 0;i < slen;i ++) {
		while(j && s[i] != p[j]) {
			j = Next[j];
		}
		if(s[i] == p[j]) j ++;
		if(j == plen) {
			cout << i + 2 - plen << endl;;
		}
		if(i - last >= plen) {
			cnt ++;
			last = i;
		}
	} 
}

例题：P3375 【模板】KMP

模版题，所以你可以直接秒了

但是还是放一下code

点击查看代码

#include<bits/stdc++.h>
using namespace std;
char s1[1000005], s2[1000005];
int Next[1000005], cnt, len1, len2;
void getNext(char *p, int plen) {
	Next[0] = 0, Next[1] = 0;
	for(int i = 1;i <= plen;i ++) {
		int j = Next[i];
		while(j && p[i] != p[j]) {
			j = Next[j];
		}
		if(p[i] == p[j]) {
			Next[i + 1] = j + 1;
		}
		else Next[i + 1] = 0;
	}
}
void kmp(char *s, char *p) {
	int last = -1;
	int slen = strlen(s), plen = strlen(p);
	getNext(p, plen);
	int j = 0;
	for(int i = 0;i < slen;i ++) {
		while(j && s[i] != p[j]) {
			j = Next[j];
		}
		if(s[i] == p[j]) j ++;
		if(j == plen) {
			cout << i + 2 - plen << endl;;
		}
		if(i - last >= plen) {
			cnt ++;
			last = i;
		}
	} 
}
signed main() {
	cin >> s1 >> s2;
	kmp(s1, s2);
	len2 = strlen(s2); 
	for(int i = 1;i <= len2;i ++) {
		cout << Next[i] << " ";
	} 
}

posted @ 2025-10-31 09:19 CuteFurina 阅读(10) 评论(0) 收藏举报

刷新页面返回顶部

Furina