KMP算法 Next数组详解

题面

题目描述

如题,给出两个字符串s1和s2,其中s2为s1的子串,求出s2在s1中所有出现的位置。

为了减少骗分的情况,接下来还要输出子串的前缀数组next。如果你不知道这是什么意思也不要问,去百度搜[kmp算法]学习一下就知道了。
输入输出格式

输入格式:

第一行为一个字符串,即为s1(仅包含大写字母)

第二行为一个字符串,即为s2(仅包含大写字母)

输出格式:

若干行,每行包含一个整数,表示s2在s1中出现的位置

接下来1行,包括length(s2)个整数,表示前缀数组next[i]的值。

输入样例:

ABABABC
ABA

输出样例:

1
3
0 0 1

说明

时空限制:1000ms,128M
数据规模:
设s1长度为N,s2长度为M
对于30%的数据:N<=15,M<=5
对于70%的数据:N<=10000,M<=100
对于100%的数据:N<=1000000,M<=1000

题解

这是一道KMP裸题(模板题。。)
我就是拿着它学习一下KMP算法
其实原来我学过KMP算法
但是一直没有弄懂next(跳转)数组是如何求出来的。
最近花了一个下午自己研究了一下KMP算法
现在终于觉得KMP很简单了~




现在直接说next数组把
至于有什么作用,next数组是干什么的,请自行百度,有很多dalao总结的非常到位,看一看就会明白。


好,来说next数组


这里写图片描述


并不用在意这一坨黑的是什么东西,我们就假设他是我们要求next数组的字符串。


next数组求的东西就是从起始位置到当前位置最长的相等的前缀和后缀的长度。
(举个例子China的前缀有:C、Ch、Chi、Chin、China ; 后缀有a、na、ina、hina、China)

这里写图片描述




我们继续,如上图红色的是当前位置(设为j)前,所匹配上的最长前缀和后缀,蓝色的是当前要匹配的位置。

这里写图片描述

那么,我们就拿当前位置和原来匹配到的最长前缀的后一位相比较
如果两个位置相同,
显然,
可以和前面的红色连在一起,
此时就有next[j]=next[j-1]+1

如果两个位置不相同,
根据next数组的性质,
显然的,你的当前的相等的前缀和后缀只能够继续向前找,
也就是说,你当前的next数组一定会减小。

这里写图片描述


既然前面的红色部分存在一小块灰色,那么,后面的红色部分也必然存在灰色部分。


这里写图片描述




所以,判断当前位置和前面那一块灰色的前缀的后一位是否相等。
如果这两位相同的话,不就可以和前面的灰色部分连在一起了吗


这里写图片描述

此时,又回到一开始的那一步。
因此,求解某个位置的next值是一个循环过程。
不断检查 上一位的 最长前缀的 后一位(i位置)(这句子有点拗口)
如果相等next[j]=next[i]+1
否则令 i=next[i-1]+1,继续循环匹配

如果没有看懂就自己多看几遍,自己找几个字符串算一算

所以:求解next数组的代码:

inline void GetNext(string s)//获得字符串s的next数组
{
    int l=s.length(),t;
    Next[0]=-1;//如果在0位置失配则是向下移动一位
    for(int i=1;i<l;++i)//依次求解后面的next数组
    {
        t=Next[i-1];
        while(s[t+1]!=s[i]&&t>=0)//循环求解next值 
            t=Next[t];
        if(s[t+1]==s[i])//如果是匹配上而退出循环 
            Next[i]=t+1;
        else            //否则则是匹配不上 
            Next[i]=-1; //指向头 
    }
}




代码很简洁的~
那么,接下来如何利用Next数组求解匹配
那就自己baidu吧(知道了next数组,KMP就很好理解了)

接下来贴上小蒟蒻的源码

#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cmath>
#include<vector>
#include<algorithm>
using namespace std;
const int MAX=1001;
int Next[MAX];
vector<int> Ans;
inline void GetNext(string s)//获得字符串s的next数组
{
    int l=s.length(),t;
    Next[0]=-1;//如果在0位置失配则是向下移动一位
    for(int i=1;i<l;++i)//依次求解后面的next数组
    {
        t=Next[i-1];
        while(s[t+1]!=s[i]&&t>=0)//循环求解next值 
            t=Next[t];
        if(s[t+1]==s[i])//如果是匹配上而退出循环 
            Next[i]=t+1;
        else            //否则则是匹配不上 
            Next[i]=-1; //指向头 
    }
}
inline void KMP(string s1,string s2)
{
    GetNext(s2);
    int l1=s1.length();
    int l2=s2.length();
    int i=0,j=0;
    while(j<l1)
    {
        if(s2[i]==s1[j])//当前位匹配成功,继续匹配下一位
        {
            ++i;++j;
            if(i==l2)//完全匹配
            {
                Ans.push_back(j-l2+1);//储存答案
                i=Next[i-1]+1;//继续匹配                
            }
        }
        else
        {
            if(i==0)//在首位不匹配
                j++;//直接向后挪一位
            else
                i=Next[i-1]+1;//跳转
        }
    }
}
int main()
{
    string s1,s2;
    int l;
    cin>>s1>>s2;
    l=s2.length();
    KMP(s1,s2);
    for(int i=0;i<Ans.size();++i)
        cout<<Ans[i]<<endl;
    for(int i=0;i<l;++i)
        cout<<Next[i]+1<<' ';
    cout<<endl;
    return 0;
}

最后再说一句
如果需要加深理解KMP的过程
请去SYC的blog看看他的gif动图
你可能就会有更多了解
膜拜SYC大佬去

posted @ 2017-07-17 16:48 小蒟蒻yyb 阅读(...) 评论(...) 编辑 收藏