字符串 Hash 的一些应用
字符串 Hash 可以快速的解决一类需要字符串匹配的问题。同时还可以以较小的思维量和代码量通过一些难题。
P3809 【模板】后缀排序,这题的正解显然是 $\mathcal{O}(n\log n)$ 的 SA,但是蒟蒻不会。所以考虑 hash,我们可以在 $\log n$ 的时间内判断两个字符串的字典序大小,方法是二分最长公共前缀,这个前缀的后一位就是第一个不同的地方,直接比较即可。在这里,我们把这个方法作为 sort
的 compare
函数,可以实现 $\mathcal{O}(n \log^2n)$ 的排序算法。在要求较为宽松时可过。
P3805 【模板】manacher,正解显然是马拉车,但是蒟蒻不会。所以考虑 hash,既然是回文串,我们预处理出前后缀的 hash,对于每个点,枚举当其为回文串中点时的最大扩展长度。
啊?这是 $\mathcal{O}(n)$ 的吗?我们考虑答案是只会递增的,所以每次从之前的最大值开始枚举,这样的话枚举次数会依次减少。证明详见 OI-Wiki。
CF1200E Compress Words:相较于上面两题,在这里,hash 就可以作为正解出现了。直接暴力维护当前总的字符串,加入新的字符时计算 hash 值,每新加入一个字符串就暴力枚举匹配长度,进行添加即可。
时间复杂度:枚举长度和处理 hash 都是 $\mathcal{O}(\sum |S_i|)$。
P3538 [POI2012] OKR-A Horrible Poem:我们要求最短循环节,等价于求满足 $\text{hash}(l,r-len)=\text{hash}(l+len,r)$ 并且 $len|(r-l+1)$ 的最小的 $len$,证明如下。
充分条件:由 $\text{hash}$ 值相等可以得到 $S[l,r-len]=S[l+len,r]$,因为 $len|(r-l+1)$ 所以可得一定能分成若干块,那么每一块左移一个块的位置就能与先前的块重合,也就是说任意相邻两个块都一样。必要条件显然。