Wait for its beauty......

KMP

不恋过往的全盘倾覆,只携前缀与后缀的默契共鸣,以预存的适配密码,在失配的岔路口轻转方向,奔赴下一场字符的重逢。—— 题记

Introduction

我们一定都听过字符串匹配问题:给定两个字符串 \(s\)\(p\)(令 \(n = |s|, m = |p|\) ),求 \(p\)\(s\) 中出现了几回,以及分别在何位置出现。

最朴素的想法是暴力的枚举每一个位置,判断是否匹配,时间复杂度 \(\mathcal O(nm)\)

抑或是采用字符串哈希的算法,虽然时间为 \(\mathcal O(n + m)\),但正确率却无法百分之百掌握。

由此引入这个算法:KMP 算法( Knuth-Morris-Pratt 算法)

由此可见,这个算法是由这三个人发明的。

花不哆嗦,进入正题。

KMP

那是一个阳光明媚的午后,你叫作 \(p\),长度为 \(m\)

你遇到了一个绝佳的女孩子,她是 \(s\),长度为 \(n\),你对她一见钟情,迫不及待地寻找着你和她身上的共同点。

失落——从头再来

你从每一个地方出发,逐一对比(见下图),就当你快要找到共同点时,却不可避免地发现了不同(标红部分),失望发现 \(p_i \ne s_j\)

你无奈,你惋惜,却也无能为力,只待失配后的从头再来。

真的只能如此了吗?

不甘——汲取往昔

你不甘,你不服,学会吸取教训,想要微调后的胜利之路。

你尝试找到下一次匹配的最近的合法起点:

你回顾上次 \(p_1 ... p_{i - 1}\)\(s_{j - i + 1} ... s_{j - 1}\) 的完美契合(蓝色部分),暗下决心找到下一个契机,让一个 \(k\) 满足 \(p_1 ... p_k\)\(s_{j - k + 1} ... s_j\) 再次相同(第三行黄标部分)。

你惊讶地发现,那一段正好需要和你的 \(p_{i - k + 1} ... p_i\) 相匹配。

你惊讶地发现,此时你无需满足她的需要,只要有一个最大的 \(k < i\) 让自己的 \(p_1 ... p_k\)\(p_{i - k + 1} ... p_i\) 共同就行。

你把这个 \(k\) 叫做你的将来,命名为 \(nxt_i\),并将它作为第 \(i\) 次失败后的存档点

它此时,就表示你的前 \(i\) 个字符,前后缀相等的最大匹配。

你的目标逐渐明晰,决心在每次失配时,轻调方向,回到 \(nxt_i\),奔赴未来。

打击——自我成就

你庆幸,你开心,却忘却 \(nxt\) 的命。

你迷茫,你伤心,却又看到 \(nxt\) 生命的意义。

前缀与后缀的共鸣,这正是你自我匹配的目的。

成功——真理之光

你似在其中找到了真谛,自我匹配 KMP 维护的 \(nxt\) 让你豁然开朗。

int j = 0; // 你自我检索的指针
nxt[1] = 0;
for(int i = 2; i <= m; i ++){
	while(j && p[i] != p[j + 1]) j = nxt[j]; // 你退,携来时之路,直至适配之际,抑或无路可退
	if(p[i] == p[j + 1]) ++ j; // 你进,为去时之道,奠定成功之基,哪怕只能为 0
	nxt[i] = j;
}

终于,在又一个午后,你带着 \(nxt\) ,朝着她 \(s\),走去。

丈量,轻退,重振雄风。

j = 0;
for(int i = 1; i <= n; i ++){
	while(j == m || (j && s[i] != p[j + 1])) j = nxt[j]; // 你学会了回到自身,与前后缀的默契共鸣,就算已成(j==m)也不怕退回再来
	if(s[i] == p[j + 1]) ++ j; // 你学会了走向前方,带着满满自信,继续匹配
	f[i] = j;
}

不再全盘推到,用自己成就自己,也许这才是 KMP 真正的勇气

你发现,你的匹配指针最多只会向前 \(n + m\) 次,你也最多只会退 \(n + m\) 次。

在这 \(\mathcal O(n + m)\) 的时间里,你终于找到和她的共同之处。

向她表白,有情人终成眷属。

inline void KMP(){
	n = strlen(s + 1), m = strlen(p + 1);
	int j = 0;
	nxt[1] = 0;
	for(int i = 2; i <= m; i ++){
		while(j && p[i] != p[j + 1]) j = nxt[j];
		if(p[i] == p[j + 1]) ++ j;
		nxt[i] = j;
	}
	j = 0;
	for(int i = 1; i <= n; i ++){
		while(j == m || (j && s[i] != p[j + 1])) j = nxt[j];
		if(s[i] == p[j + 1]) ++ j;
		f[i] = j; // 最终的成果
	}
}

反思——未来新生

结婚后,你发现,你和她的适配度很高,你又想起来 KMP。

这次,你将你 \(p\) 和她 \(s\) 拼接起来,又在其中放一个字符做区分。

你发现,当时的算法在此刻,只需运行一次,你和她的相同,再度焕发生机。

你惊叹,你惋惜,你伤感,你高兴。

为自己匹配,也为他人匹配。

这也许也是 KMP 赠与你的勇气

inline void KMP(){
	n = strlen(s + 1), m = strlen(p + 1);
	p[m + 1] = '+'; 
	for(int i = 1, j = m + 2; i <= n; j ++, i ++) p[j] = s[i]; // 你将自己与她连在一起,共同面对审查
	int j = 0, ans = 0;
	nxt[1] = 0;
	for(int i = 2; i <= m + n + 1; i ++){
		while(j && p[i] != p[j + 1]) j = nxt[j]; // 为自己,也为他人,退
		if(p[i] == p[j + 1]) ++ j; // 进
		nxt[i] = j;
	}
}

时光流转,当你在老年时,再次看着 KMP。曾经的 \(nxt\) 数组,可能已经不再适配于你。但他让你懂得:

不将过往匹配的痕迹尽数归零,而是以前缀与后缀的同源默契为基,用已证的契合成就新的衔接,让每一步过往都成为前行的阶梯,为着自己,也为他人。 —— 后记

后说

KMP 以 \(\mathcal O(n+m)\) 的高效复杂度,和百分百的正确率,完美地解决了许多刁钻的字符串问题。

许多题目,都可以最终转化成为 KMP 问题。

祝,不畏失败,以己为阶,再战未来。

posted @ 2025-11-30 20:27  Hty111  阅读(5)  评论(0)    收藏  举报