寻找字符串A中完全包含字符串B的最短子字符串

基本思路:

已知两个字符串a和b。字符串a的字符有可能重复,字符串b中的字符不重复。

编写一个算法,寻找字符串a的最短子字符串,使得该子字符串包含字符串b中的所有字符。

这是一道典型的动态规划题,有点类似编程之美中最短摘要生成那道题目。

可以使用两个指针t_rear和t_front遍历字符串a。使用两个指针rear和front记录已发现的最短字符串的边界。

使用一个变量cnt记录已经发现的b中的字符数。

定义一个数组tab[256]作为b中字符存在性的hash表,定义一个数组cal[256]存放已经发现的在ab中均出现的字符的个数。

1、刚开始t_rear和t_front均指向a的第一个字符。然后t_rear开始向后遍历。

2、每当t_rear找到一个出现的在b中存在的字符,就让cal中该字符计数加1。如果该字符第一次出现,则让cnt也加1;

3、当cnt的数值等于b的字符个数时,t_front开始往后遍历。当t_front发现一个在b中存在的字符时,就让cal中的该字符计数减1。如果减1之后计数变为0,则记录

此时t_rear和t_front的下标。如果t_rear-t_front<rear-front,则将rear和front更新为t_rear和t_front;

4、遍历完a即可确定所求的最短子字符串。

代码模板:


#include<iostream>

using namespace std;

 

void find(char a[], int Na, int tab[], int Nb);

int main()

{

	char a[]={'1', '4', '2', '3', '7', '3', '9', '3', '1', '0', '5', '7', '4', '6'};

	char b[]={'3', '9', '1'};

	int tab[256]={0};

	for(int i=0; i<3; i++)

	{

		tab[b[i]]=1;

	}

	find(a, 14, tab, 3);

	system("pause");

}

 

void find(char a[], int Na, int tab[], int Nb)

{

	int front=0, rear=Na-1;

	int t_front=0, t_rear=0;

	int cnt=0;

	int cal[256]={0};

	while(t_rear<Na)

	{

		if(tab[a[t_rear]])

		{

			

			cout<<a[t_rear]<<endl;

			if(cal[a[t_rear]]==0)

			{

				

				cnt++;

				//cout<<cnt<<endl;

			}

				

			cal[a[t_rear]]++;

			if(cnt==Nb)

			{

				while(t_front!=t_rear)

				{

					if(tab[a[t_front]])

					{

						cal[a[t_front]]--;

						if(cal[a[t_front]]==0)

							break;

					}

					t_front++;

				}

				if(t_rear-t_front < rear-front)

				{

					rear=t_rear;

					front=t_front;

				}

				t_front++;

				cnt--;

			}

			t_rear++;

		}

		else

			t_rear++;

	}

	for(int i=front; i<=rear; i++)

	{

		cout<<a[i]<<" ";

	}

	cout<<endl;

}

相似例题:

题目:小N现在有一个字符串S。他把这这个字符串的所有子串都挑了出来。一个S的子串T是合法的,当且仅当T中包含了所有的小写字母。小N希望知道所有的合法的S的子串中,长度最短是多少。

输入:

一行一个字符串S。只包含小写字母。S的长度不超过106.

输出:

一行一个数字,代表最短长度。数据保证存在一个合法的S的子串。

样例输入:

ykjygvedtysvyymzfizzwkjamefxjnrnphqwnfhrnbhwjhqcgqnplodeestu

样例输出:

49

思路:

基本思想和上面讲的是一样的。

代码:

#include<iostream>
#include<cstring>
using namespace std;
typedef long long ll;
char ch[1000005];
ll vis[30],tot[30],st,ed,lf,rg,cnt;
int main()
{
    cin>>ch;
    memset(vis,0,sizeof(vis));
    memset(tot,0,sizeof(tot));
    for(int i=1;i<=26;i++)
    vis[i]=1;          //26个字母存在性记录
    cnt=0;            //发现了26个字母中的几个。
    ll len=strlen(ch);         
    st=0;ed=len-1;     //记录最小的区间。
    lf=0;rg=0;         //用两个指针滚动
    while(rg<len)
    {
        int k=ch[rg]-'a'+1;
        if(vis[k])    //如果两个字符串都存在的字符
        {
            if(tot[k]==0)     //第一次出现的字符cnt++。
                cnt++;
            tot[k]++;      //第二个字符串在第一个字符串种出现的次数
            if(cnt==26)     //当两个字符串的交集为第二个字符串时
            {
                while(lf!=rg)
                {
                    int s=ch[lf]-'a'+1;     //移动指向开始的指针
                    if(vis[s])
                    {
                        tot[s]--;
                        if(tot[s]==0)        //当有一个字符的个数减为0时,跳出循环
                            break;
                    }
                    lf++;             //继续移动指针
                }
                if(rg-lf<ed-st)       //比较区间,更新区间
                {
                    st=lf;ed=rg;
                }
                lf++;cnt--;         //cnt减一,指针移动一位
            }
            rg++;
        }
        else
            rg++;
    }
    cout<<ed-st+1<<endl;
}

 

posted @ 2018-08-31 22:39  Leozi  阅读(710)  评论(0编辑  收藏  举报