Manacher（马拉车）————O(n)回文子串

Manacher

一、背景

1975年，Manacher发明了Manacher算法（中文名：马拉车算法），是一个可以在O(n)的复杂度中返回字符串s中最长回文子串长度的算法，十分巧妙。

让我们举个栗子，栗子：

1.字符串：abbababa 最长回文子串：5（abbababa）

2.字符串：abcbbabbc 最长回文子串：7（abcbbabbc）

3.字符串：abccbaba 最长回文子串：6（abccbaba）

传统方法是，遍历每个字符，以该字符为中心向两边查找。时间复杂度为O(n^2)，效率很差；

而这个神奇的Manacher算法将复杂度提升到了O(n)。

来一起瞅一瞅它是如何工作的吧。

二、算法过程分析

回文分为奇回文（ababa）和偶回文（abba），这里比较难以处理，我们使用一个小(sao)技(cao)巧(zuo)（很重要）。我们将字符串首尾和每个字符间插入一个字符（注意：这个自符在串中并未出现）例如：'#'.

栗子！栗子！s='abbadcacda'先转化成s_new='$#a#b#b#a#d#c#a#c#d#a#\0'（'$'与'\0'，是边界，下面的代码中可以看到）

这样原串中的偶回文（abba）与奇回文（adcacda），变成了（#a#d#d#a#）与（#a#d#c#a#c#d#a#）两个奇回文。

定义数组p[]，用p[i]表示以i为中心的最长回文半径。栗子在这里：

那，p[i]该如何求呢？很显然，p[i]-1正好就是原字符中的最长回文串长度了。

让我们一起找到正解。

请看下图：

定义两个变量mx和id。mx就是以id为中心的最长回文右边界，也就是mx=id+p[id]，随后我们需要mx做出它的最大贡献。

假设我们在求p[i]（以i为中心的最长回文半径），如果i<mx（如上图），那么我们就用mx和j来更新到我们已知的可以更新的最大长度，代码如下：

if(i<mx)  
    p[i]=min(p[2*id-i],mx-i);

2*id-i是i关于id的对称点（上图j）（证明：i-id=id-j），而p[j]表示以j为中心的最长回文半径，这样我们就可以利用p[j]和mx加快速度了。

为什么要用p[j]和mx-i取min来更新，什么鬼？

淡定，淡定。我们想一下，p[j]（以j为中心的最长回文半径）是已经知道了（因为是从前面扫过来的），若是p[j]>mx-i，我们是可以知道以j为中心，以mx的对称点到j的距离为半径形成的回文字符串是肯定存在的，并且id的左边直到mx的对称点与id的右边直到mx是一一对应的，不难理解mx是i目前可以更新到的最大回文半径；若p[j]<mx-i，证明j的回文半径不到mx的对称点到j的距离，再次通过（id的左边直到mx的对称点与id的右边直到mx是一一对应的），不难想到p[i]=p[j]。

取完min就是最大的回文半径吗？

显然不是，接下来的暴力往后扫就好了（学oi的都有暴力倾向）。

三、代码

#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>

using namespace std;

char s[11000002];
char s_new[21000002];//存添加字符后的字符串 
int p[21000002];

int Init() {//形成新的字符串 
    int len=strlen(s);//len是输入字符串的长度
    s_new[0]='$';//处理边界，防止越界 
    s_new[1]='#';
    int j=2; 
    for(int i=0;i<len;i++) {
        s_new[j++]=s[i];
        s_new[j++]='#';
    } 
    s_new[j]='\0';//处理边界，防止越界（容易忘记） 
    return j;// 返回s_new的长度 
}

int Manacher() {//返回最长回文串 
    int len=Init();//取得新字符串的长度， 完成向s_new的转换
    int max_len=-1;//最长回文长度
    int id;
    int mx=0;
    for(int i=1;i<=len;i++) {
        if(i<mx)
            p[i]=min(p[2*id-i],mx-i);//上面图片就是这里的讲解 
        else p[i]=1;
        while(s_new[i-p[i]]==s_new[i+p[i]])//不需边界判断，因为左有'$'，右有'\0'标记；
            p[i]++;//mx对此回文中点的贡献已经结束，现在是正常寻找扩大半径
        if(mx<i+p[i]) {//每走移动一个回文中点，都要和mx比较，使mx是最大，提高p[i]=min(p[2*id-i],mx-i)效率 
            id=i;//更新id 
            mx=i+p[i];//更新mx 
        }
        max_len=max(max_len,p[i]-1); 
    } 
    return max_len; 
}
 
int main()
{
    scanf("%s",&s);
    printf("%d",Manacher());
    return 0;
}

四、复杂度

完结撒花（复杂度不会证明呀，因为我是蒟蒻）

posted @ 2019-07-10 20:04 沉~杉阅读(12871) 评论(8) 收藏举报

刷新页面返回顶部

沉~杉

每一个不曾起舞的日子，都是对生命的辜负。

Manacher（马拉车）————O(n)回文子串

公告