hihocoder 1015 KMP(找多个位置的 【*模板】)

#1015 : KMP算法

时间限制:1000ms
单点时限:1000ms
内存限制:256MB

描述

小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。

这一天,他们遇到了一只河蟹,于是河蟹就向小Hi和小Ho提出了那个经典的问题:“小Hi和小Ho,你们能不能够判断一段文字(原串)里面是不是存在那么一些……特殊……的文字(模式串)?

小Hi和小Ho仔细思考了一下,觉得只能想到很简单的做法,但是又觉得既然河蟹先生这么说了,就肯定不会这么容易的让他们回答了,于是他们只能说 道:“抱歉,河蟹先生,我们只能想到时间复杂度为(文本长度 * 特殊文字总长度)的方法,即对于每个模式串分开判断,然后依次枚举起始位置并检查是否能够匹配,但是这不是您想要的方法是吧?”

河蟹点了点头,说道:”看来你们的水平还有待提高,这样吧,如果我说只有一个特殊文字,你能不能做到呢?“

小Ho这时候还有点晕晕乎乎的,但是小Hi很快开口道:”我知道!这就是一个很经典的模式匹配问题!可以使用KMP算法进行求解!“

河蟹满意的点了点头,对小Hi说道:”既然你知道就好办了,你去把小Ho教会,下周我有重要的任务交给你们!“

”保证完成任务!”小Hi点头道。

提示一:KMP的思路

提示二:NEXT数组的使用

提示三:如何求解NEXT数组

输入

第一行一个整数N,表示测试数据组数。

接下来的N*2行,每两行表示一个测试数据。在每一个测试数据中,第一行为模式串,由不超过10^4个大写字母组成,第二行为原串,由不超过10^6个大写字母组成。

其中N<=20

输出

对于每一个测试数据,按照它们在输入中出现的顺序输出一行Ans,表示模式串在原串中出现的次数。

样例输入
5
HA
HAHAHA
WQN
WQN
ADA
ADADADA
BABABB
BABABABABABABABABB
DAD
ADDAADAADDAAADAAD
样例输出
3
1
3
1
0

#include <iostream>
#include <string>
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <stack>

using namespace std;

void GET_next(string t, int next[])
{
    int j, k;
    j=0; k=-1;
    next[0]=-1;
    int len=t.size();

    while(j<len )
    {
        if(k==-1 || t[j]==t[k] )
        {
            j++;
            k++;
            next[j]=k;
        }
        else
            k=next[k];
    }
}

int KMP(string s, string t, int next[] )
{
    int i, j;
    i=0; j=0;
    int len1=s.size();
    int len2=t.size();

    int cnt=0;

    while(i<len1 )
    {
        if(j==-1 || s[i]==t[j] )
        {
            i++;
            j++;
        }
        else if(j<len2)
            j=next[j];
        if(j==len2 )
        {
            cnt++;
            j=next[len2];
        }
    }

    return cnt;
}


int main()
{
    string s, t;
    int i, j;
    int len1, len2;
    int next[10002];
    int tt;
    cin>>tt;
    while(tt--)
    {
        cin>>t;
        cin>>s;
        len1=s.size();
        len2=t.size();

        GET_next(t, next);
        printf("%d\n", KMP(s, t, next));
    }
    return 0;
}

第二种写法:基于STL的结构实现

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <iostream>
#include <string>
#include <vector>
#include <iomanip>
#include <algorithm>

using namespace std;

//实现一种算法使得能够在线性的时间复杂度内:求出一个串在两一个串的所有匹配位置
// O(N+M)
//pattern 模式串
//text 文本串

int find_substring(string pattern, string text )
{
	int n=pattern.size();
	vector<int>next(n+1, 0);

	for(int i=1; i<n; i++)
	{
		int j=i;
		while(j>0)
		{
			j=next[j];
			if(pattern[j] == pattern[i])
			{
				next[i+1] = j+1;
				break;
			}
		}
	}
	int cnt=0;
	int m = text.size();
	for(int i=0, j=0; i<m; i++)
	{
		if(j<n && text[i]==pattern[j] )
			j++;
		else
		{
			while(j>0)
			{
				j=next[j];
				if(text[i] == pattern[j] )
				{
					j++;
					break;
				}
			}
		}
		if(j==n)
			cnt++;
	}
	return cnt;
}

int main()
{
	int tt;
	scanf("%d%*C", &tt);
	string t, s;
	while(tt--)
	{
		cin>>t;
		cin>>s;
		int dd;
		dd=find_substring(t, s);
		printf("%d\n", dd);
	}
	return 0;
}

 如果模式串在主串中有多个位置,不是要输出出现的次数,而是要输出每个位置!在上面代码的基础上打表存储一下即可!

vector<int> find_substring(string pattern, string text ) //返回一个vector数组
{
	int n=pattern.size();
	vector<int>next(n+1, 0);

	for(int i=1; i<n; i++)
	{
		int j=i;
		while(j>0)
		{
			j=next[j];
			if(pattern[j] == pattern[i])
			{
				next[i+1] = j+1;
				break;
			}
		}
	} 
	vector<int>position;
	int m = text.size();
	for(int i=0, j=0; i<m; i++)
	{
		if(j<n && text[i]==pattern[j] )
			j++;
		else
		{
			while(j>0)
			{
				j=next[j];
				if(text[i] == pattern[j] )
				{
					j++;
					break;
				}
			}
		}
		if(j==n)
			position.push_back(i-n+1); //打表存储位置
	}
	return position; //返回存储位置的vector数组
}

 

posted @ 2014-12-21 20:19  我喜欢旅行  阅读(290)  评论(0编辑  收藏  举报