第五次作业 实验三 串的模式匹配

这个作业属于哪个课程 https://edu.cnblogs.com/campus/qdu/DS2020
这个作业要求在哪里 https://edu.cnblogs.com/campus/qdu/DS2020/homework/11392
这个作业的目标 ①了解串的基本概念②掌握串的模式匹配算法的实现
学号 2018204167

一、实验目的

1、了解串的基本概念
2、掌握串的模式匹配算法的实现

二、实验预习

说明以下概念
1、模式匹配:

串的模式匹配即子串定位,即查找子串在主串中出现的位置,是一种重要的串的运算。设S是给定的主串,T是给定的子串,在主串S中查找等于子串T的串的过程成为模式匹配,T称为模式串。

2、BF算法:

BF算法,即暴力(Brute Force)算法,是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和T的第二个字符;若不相等,则比较S的第二个字符和T的第一个字符,依次比较下去,直到得出最后的匹配结果。BF算法是一种蛮力算法。

3、KMP算法:

KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人们称它为克努特—莫里斯—普拉特操作(简称KMP算法)。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到最快匹配的目的。具体实现就是通过一个next()函数实现,函数本身包含了模式串的局部匹配信息。KMP算法的时间复杂度O(m+n)

三、实验内容和要求

1、阅读并运行下面程序,根据输入写出运行结果。
#include<stdio.h>
#include<string.h>
#define MAXSIZE 100
typedef struct{
	char data[MAXSIZE];
	int length;
}SqString;

int strCompare(SqString *s1,SqString *s2); /*串的比较*/
void show_strCompare();
void strSub(SqString *s,int start,int sublen,SqString *sub); 
/*求子串*/
void show_subString();

int strCompare(SqString *s1,SqString *s2){
	int i;
	for(i=0;i<s1->length&&i<s2->length;i++)
		if(s1->data[i]!=s2->data[i])
			return s1->data[i]-s2->data[i];
	return s1->length-s2->length;
}
void show_strCompare(){
    SqString s1,s2;
    int k;
    printf("\n***show Compare***\n");
    printf("input string s1:");
    gets(s1.data);
    s1.length=strlen(s1.data);
    printf("input string s2:");
    gets(s2.data);
    s2.length=strlen(s2.data);
    if((k=strCompare(&s1,&s2))==0)
        printf("s1=s2\n");
    else if(k<0)
        printf("s1<s2\n");
    else
        printf("s1>s2\n");
    printf("\n***show over***\n");
}

void strSub(SqString *s,int start,int sublen,SqString *sub){
	int i;
	if(start<1||start>s->length||sublen>s->length-start+1){
		sub->length=0;
	}
	for(i=0;i<sublen;i++)
		sub->data[i]=s->data[start+i-1];
	sub->length=sublen;
}
void show_subString(){
    SqString s,sub;
    int start,sublen,i;
    printf("\n***show subString***\n");
    printf("input string s:");
    gets(s.data);
    s.length=strlen(s.data);
    printf("input start:");
    scanf("%d",&start);
    printf("input sublen:");
    scanf("%d",&sublen);
    strSub(&s,start,sublen,&sub);
    if(sub.length==0)
        printf("ERROR!\n");
    else{
        printf("subString is :");
        for(i=0;i<sublen;i++)
            printf("%c",sub.data[i]);
    }
    printf("\n***show over***\n");
}

int main(){
    int n;
    do {
        printf("\n---String---\n");
        printf("1. strCompare\n");
        printf("2. subString\n");
        printf("0. EXIT\n");
        printf("\ninput choice:");
        scanf("%d",&n);
        getchar();
        switch(n){
            case 1:show_strCompare();break;
            case 2:show_subString();break;
            default:n=0;break;
        }
    }while(n);
    return 0;
}
运行程序
输入:

1
student
students
2
Computer Data Stuctures
10
4

运行结果:

2、实现串的模式匹配算法。补充下面程序,实现串的BF和KMP算法。
#include<stdio.h>
#include<string.h>

#define MAXSIZE 100

typedef struct{
	char data[MAXSIZE];
	int length;
}SqString;

int index_bf(SqString *s,SqString *t,int start);
void getNext(SqString *t,int next[]);
int index_kmp(SqString *s,SqString *t,int start,int next[]);
void show_index();

int index_bf(SqString *s,SqString *t,int start){
	int i,j,pos;
	if(t->length==0)
	return(0);
	pos=start;
	i=pos;
	j=0;
	while(i<s->length&&j<t->length)
	if(s->data[i]==t->data[j])
	{
		i++;j++;
	}
	else
	{
		pos++;
		i=pos;
		j=0;
	}
	if(j>t->length)
	return(pos);
	else
	return(-1);
}

void getNext(SqString *t,int next[]){
	int i=0,j=-1;
	next[0]=-1;
	while(i<t->length)
	{
		if(j==-1||(t->data[i]==t->data[j]))
		{
			i++;
			j++;
			next[i]=j;
		}
		else
		j=next[j];
	}
}

int index_kmp(SqString *s,SqString *t,int start,int next[]){
	int i,j;
	if(t->length=0)
	return(0);
	while(i<s->length&&j<t->length)
	if(s->data[i]==t->data[j])
	{
		i++;j++;
	}
	else
	j=next[j];
	if(j>=t->length)
	return(i-j);
	else
	return(-1);
}

void show_index(){
	SqString s,t;
	int k,next[MAXSIZE]={0},i;
	printf("\n***show index***\n");
	printf("input string s:");
	gets(s.data);
	s.length=strlen(s.data);
	printf("input string t:");
	gets(t.data);
	t.length=strlen(s.data);
	printf("input start position:");
	scanf("%d",&k);
	printf("BF:\nthe result of BF is %d\n",index_bf(&s,&t,k));
	getNext(&t,next);
	printf("KMP:\n");
	printf("next[]:");
	for(i=0,i<t.length;i++;)     
	    printf("%3d",next[i]);
	printf("\n");
	printf("the result of KMP is %d\n",index_kmp(&s,&t,k,next));
	printf("\n***show over***\n");     
}

int main(){
	show_index();
	return 0;
}

输入:

abcaabbabcabaacbacba
abcabaa
1

运行结果:

四、实验小结

在这次实验中,更深刻的理解了串的概念,以及其模式匹配算法,对BF算法和KMP算法也有了更深刻的认识。
①BF算法基于主串指针回溯,重新与子串进行逐字符进行比较,主串要进行回溯是因为在模式P中存在相同的字符或者说由字符(串)存在重复(模式的部分匹配性质),设想如果模式P中字符各不相同,主串就S的指针就根本不需要回溯;然而,可以发现在主串S与模式发生失配时,主串指针进行回溯会影响效率,因为由于模式S本身字符的部分匹配性质,回溯之后,主串S与模式P有些部分比较是没有必要的,这就是对BF算法所要改进的地方。
②KMP算法针对BF算法的缺点进行了改进,关键就是主串S与模式P发生失配时,如果主串S指针不进行回溯,那么下面应该与模式中的某一位置的字符进行比较,一旦在模式中找到这样的位置,说明我们不需要每次与模式P重新开始匹配,这就意味着KMP算法会直接跨过较多的位数,起到加速的作用。

posted @ 2020-10-30 14:07  Cdice  阅读(937)  评论(0编辑  收藏  举报