Loading

浅谈区间MEX问题

区间MEX问题

MEX是什么

​ MEX:指一个序列中最小没有出现过的自然数。

​ 例如 \(mex\left\{1, 2, 0, 3\right\} = 4\),\(mex\left\{5, 1, 2, 3\right\} = 0\)\(mex\left\{0, 2, 1, 5\right\} = 3\)

​ 在谈到区间MEX之前,我们先实现一个维护MEX的数据结构。

​ 这个数据结构需要支持这样的操作:

  1. 对集合进行插入或删除
  2. 查询集合的MEX

​ 我们可以开一个 \(vis\) 数组,表示某个数是否出现过。那么往集合中插入一个数的时候,就把 \(vis_i\) 标记为 1 ,删除就标记为 0 。查询的时候,就从0开始暴力枚举,第一个 \(vis_i=0\) 的就是 MEX。显然,这样时间复杂度是非常高的,我们考虑优化一下这个暴力枚举的过程。我们可以维护一个 \(set\) ,表示未出现的数的集合,当我们添加一个新的数的时候,就在 \(set\) 中将其删去,如果删除操作使得一个数没有出现过,就把他加入\(set\) 。那么查询 MEX 的时候直接查询 \(set\) 中的最小值即可。

int cnt[N];
set<int> st;
int m, op, x;

void solve()
{
    for(int i = 0; i < N; i ++)
        st.insert(i);
    cin >> m;
    while(m --)
    {
        cin >> op;
        if(op == 0) //add
        {
            cin >> x;
           	if(cnt[x] == 0)
                st.erase(x);
            cnt[x] ++;
        }
        else if(op == 1) //query
        {
            cout << *st.begin() << '\n';
        }
        else //delete
        {
            cin >> x;
            if(-- cnt[x] == 0)
                st.insert(x);
	}
    }
}

复杂度为 \(O(nlogn)\)

注:在长度为 n 的集合中,MEX的最大值为 n,所以可以把大于 n 的都改为 \(n + 1\)

区间MEX

在了解MEX的概念之后,我们引入一道题目来说明一下什么是区间MEX

Rmq Problem / mex

区间MEX,就是查询一个序列中指定区间的MEX,序列不带修。

方法1:离线 + 线段树

​ 这是一个区间问题,对于区间问题我们常常可以考虑是否能够通过离线来处理问题。线段树维护的是一个叫 \(last\_pos\) 的东西,表示某个数最后一次在数组中出现的位置,维护他的区间最小值。我们先对询问区间按右端点排序,遍历一遍 1 到 n ,把 \(a_i\) 更新到线段树中的同时,若 \(i = query[j].R\) ,这个时候就可以对 \(query[j]\) 的答案进行计算了。怎么计算呢?我们直接找到最后一次位置小于 \(query[j].l\) 的最小的数。那我们直接在线段树上二分就可以了。

#include <bits/stdc++.h>

using namespace std;
const int N = 300005;
struct ASK {
	int l, r, id, mex;
};
int n, m;
int a[N];
ASK Q[N];

struct Seg_tree1  {
    struct Tree {
    	int l, r;
    	int v;
    } seg[N << 2];
    void pushup(int k)
    {
        seg[k].v = min(seg[k << 1].v, seg[k << 1 | 1].v);
    }
    void build(int k, int l, int r)
    {
        seg[k] = {l, r, 0};
        if(l == r) {
            return;
        }   
        int mid = (l + r) >> 1;
        build(k << 1, l, mid);
        build(k << 1 | 1, mid + 1, r);
    }
    void modify(int k, int pos, int x)
    {
        int l = seg[k].l, r = seg[k].r;
        if(l == r) {
            seg[k].v = x;
            return;
        }
        int mid = (l + r) >> 1;
        if(pos <= mid)
            modify(k << 1, pos, x);
        else
            modify(k << 1 | 1, pos, x);
        pushup(k);
    }
    int query(int k, int pos)
    {
        int l = seg[k].l, r = seg[k].r;
        if(l == r) {
            return seg[k].l;
        }
        if(seg[k << 1].v < pos)
            return query(k << 1, pos);
        else
            return query(k << 1 | 1, pos);
    }
};

Seg_tree1 T1;

int main()
{
    scanf("%d%d", &n, &m);
    for(int i = 1; i <= n; i ++)
    {
    	scanf("%d", &a[i]), a[i] ++;
        a[i] = min(a[i], n + 2);
    }
    T1.build(1, 1, n + 2);

    for(int i = 1; i <= m; i ++)
    {
    	int l, r;
    	scanf("%d%d", &l, &r);
    	Q[i] = {l, r, i, 0};
    }

    sort(Q + 1, Q + m + 1, [](ASK a, ASK b) {return a.r < b.r;});

    for(int i = 1, j = 1; i <= n; i ++)
    {
    	T1.modify(1, a[i], i);
    	while(j <= m && Q[j].r == i)
    	{
    	    Q[j].mex = T1.query(1, Q[j].l);
       	    j ++;
    	}
    }

    sort(Q + 1, Q + m + 1, [](ASK a, ASK b) {return a.id < b.id;});
    for(int i = 1; i <= m; i ++)
    	printf("%d\n", Q[i].mex - 1);
}

方法2:在线 + 主席树

​ 如果学习过主席树的话,不难想到,跟上面离线的思想是一模一样的,对于一个询问 \([L, R]\) ,我们可以直接在 \(root[R]\) 上进行查询第一个最后一次出现的位置小于 \(L\) 的权值即可。

#include <bits/stdc++.h>

using namespace std;
const int N = 200005;

int tot = 0;
struct node {
    int ls, rs;
    int v;
} seg[N * 24];
int rt[N], a[N];
int n, m;

void pushup(int k)
{
    seg[k].v = min(seg[seg[k].ls].v, seg[seg[k].rs].v);
}
int modify(int old, int l, int r, int pos, int v)
{
    int p = ++tot;
    seg[p] = seg[old];
    if (l == r)
    {
        seg[p].v = v;
        return p;
    }
    int mid = (l + r) >> 1;
    if (pos <= mid)
        seg[p].ls = modify(seg[old].ls, l, mid, pos, v);
    else
        seg[p].rs = modify(seg[old].rs, mid + 1, r, pos, v);
    pushup(p);
    return p;
}
int query(int p, int l, int r, int pos)
{
    if (l == r)
    {
        return l;
    }
    int mid = (l + r) >> 1;
    if (seg[seg[p].ls].v < pos)
        return query(seg[p].ls, l, mid, pos);
    else
        return query(seg[p].rs, mid + 1, r, pos);
}

int main()
{
    ios::sync_with_stdio(false);
    cin.tie(0);
    cin >> n >> m;
    for (int i = 1; i <= n; i++)
    {
        cin >> a[i];
        rt[i] = modify(rt[i - 1], 0, n, a[i], i);
    }
    while (m--)
    {
        int l, r;
        cin >> l >> r;
        cout << query(rt[r], 0, n, l) << '\n';
    }
}

题单:

ittle w and Discretization

C. The Third Problem

C. Meximum Array

D1. Balance (Easy version)

D2. Balance (Hard version)

D.MEX Tree

posted @ 2023-01-02 18:04  DM11  阅读(725)  评论(0编辑  收藏  举报