给一个长度为n的字符串，找出长度为m的最小字典子序列【单调栈】

一个大大的分割线，如果这个傻逼题没有被作为某某复赛的签到题，可能我一会都一直傻逼下去了。
【2019计蒜之道复赛——星云系统】
题目是，给出一个长度为n(1<n<5e6)的只有小写字母的字符串，然后找出一个长度为m的最小字典子序列。
更新： 这是一道简单得要死掉的单调栈裸题，为什么没想到呢，因为思路是，利用单调栈尽量求取结果字符串的最优值，也就说结果字符串在理想情况下是递增的，但是非理想情况是什么呢？因为有必须限定k个字母存在，因此被删掉的字母数量为len-k个字符，当被单调栈弹出的字符数量达到n-k个时，剩余的字符【即单调栈中的递增字符以及未遍历到的剩余字符】就组成了最小字典序ans。

散了散了。。。时间复杂度是线性扫描的O(n)
想想也是，题面都这个数量级了，还要啥常数。线性就完了。

#include<bits/stdc++.h>
#define M(a,b) memset(a,b,sizeof a)
#define LL long long
using namespace std;
const int maxn=5000007;
char a[maxn];
stack<char>q;
int n,m;
int main()
{
    while(!q.empty())q.pop();
    scanf("%s %d",a,&m);
    n=strlen(a);
    int cnt=0;
    int flag=n;
    for(int i=0; i<n; i++)
    {
        if(q.empty())q.push(a[i]);
        else
        {
            if(a[i]>q.top())q.push(a[i]);
            else
            {
                while(!q.empty()&&q.top()>a[i])
                {
                    q.pop();
                    cnt++;
                    if(cnt>=n-m)
                    {
                        flag=i;
                        break;
                    }
                }
                q.push(a[i]);
            }
        }
        if(cnt>=n-m)break;
    }
    string ans="";
    for(int i=n-1;i>flag;i--)ans+=a[i];
    while(!q.empty())ans+=q.top(),q.pop();
    reverse(ans.begin(),ans.end());
    ans=ans.substr(0,m);
    cout<<ans<<"\n";
}

头条一面挂了，除了自己菜，数据结构和基础知识理解不够深刻外，还有就是面试时紧张得肚子疼到抽搐。。。可能是绝症了

言归正传，面试官本来想随便出个签到题玩一下开个场，结果被我紧张的崩了。
结束面试之后冷静下来认真想了下并不难

题目是，给出一个长度为n(1<n<10000)的只有小写字母的字符串，然后找出一个长度为m的最小字典子序列。
如 orange
当m=3时，输出结果age

若borange,且长度为3时，同样输出age

面试的时候脑子一团浆糊，想到了标号和排序，直接被反例否定了。

如果用最暴力的思想，找到n个字符里字典序最小且位序小于等于m的字母，然后砍去这个字母之前的字母，在剩余的字母中又找一个字典序最小的字母，这样一直找m个就好了。
唯一要考虑的条件就是，这样不断贪心取最小的要求是，要保证取了某个字母后，剩余待选串中的字符个数要大于等于m。

于是想到一个 复杂度为O(n*m) 的做法，每次遍历n字符串，查找符合条件的字符，再从头扫一遍找下一个字符。从头扫的原因是，当找到了一个字符，比如b，无法判断是否后面的字符是否存在一个字典序小于b的字符，所以仍要遍历完整个串才能得到一个最小值。这样是不可取的，必须进行优化。

那么做一个预处理，首先26个vector存储每个字母出现位置的下标，O(n)遍历字符串，push进每个字母出现下标，因为是顺序遍历，所以每个vector都是有序的。
然后遍历m次这26个vector，找出第一个字母的出现位置，满足<=n-(m-i)+1,说明存在一个较小的字母符合筛选条件，并且不用关心该位置剩余字符串是否存在比其更小的字母，如果存在，在字典序遍历其他vector就应该找到了。在ans中填入这个字母，然后从a字母开始继续查找下标大于上一个填入ans中字母下标的符合条件的字母。这个在有序vector中查找位置直接用二分即可。
最后时间复杂度O(26*m),空间复杂度O(n)
代码如下：

#include<bits/stdc++.h>
using namespace std;
char a[10080];
vector<int>pos[26];
int main()
{
    int n,m;
    char ans[10080];
    while(scanf("%d",&n)!=EOF)
    {
        for(int i=0;i<=26;i++)pos[i].clear();
        scanf("%d",&m);
        scanf("%s",a);
        for(int i=0; i<n; i++) pos[a[i]-'a'].push_back(i+1);
        memset(ans,0,sizeof ans);
        int tmp=0;
        for(int i=0; i<m; i++)
        {
            for(int j=0; j<26; j++)
            {
                if(pos[j].size()!=0)
                {
                    int num=pos[j][upper_bound(pos[j].begin(),pos[j].end(),tmp)-pos[j].begin()];
                    if(num>tmp&&num<=n-m+i+1)
                    {
                        tmp=num;
                        ans[i]='a'+j;
                        break;
                    }
                }
            }
        }
        printf("%s\n",ans);
    }
}

posted @ 2018-12-18 12:53 KuroNekonano 阅读(2546) 评论(0) 收藏举报

刷新页面返回顶部

KuroNekonano

给一个长度为n的字符串，找出长度为m的最小字典子序列【单调栈】

公告