<算法笔记01>ST表

st表

需求：输入一个序列\(A[n]\)，进行\(q\)次查询，每次查询求\([l,r]\)区间的最大值。
问题：暴力的求法是，每次都遍历一下，求最大值，显然这个非常慢。所以我们需要引入一个高效的数据结构。
介绍：st表根据倍增思想实现的数据结构，主要用来求解RMQ问题，\(O(1)\)的时间复杂度求出某个区间的最大值，最小值。

算法介绍

预处理

首先，我们设\(STMax[i][j]\)：从\(i\)开始的区间长度为\(2^j\)的最大值，即区间范围为\([i,2^j-1]\)。

那么很显然，对于原数组\(A[]\)，我们有\(A[i]=STMax[i][0]\)。我们直接读入即可。（不用再建立\(A[]\)数组）

    for(int i=1;i<=n;i++){
        scanf("%d",&st[i][0]);
    }

我们如何去维护好\(STMax[i][j]\)呢，很简单，根据\(max\)最大值的一个性质，\(max(1,2,3,4)=max(max(1,2),max(3,4))\)。是不是看到公式就头晕，让我们来举个例子。

假设已知区间\([1,2][3,4]\)的最大值分别为\(a,b\)，我们要求\([1,4]\)的最大值，只需要求\(max(a,b)\)。

好，我们继续深入，如果要求\([1,8]\)的最大值，我们只需要求出\([1,4],[5,8]\)的最大值，然后在他们之中再取最大值即可。一直递增，我们可以求出更多的最大值，这个便是区间动态规划。

所以我们可以维护好区间长度，不断递推出更多的区间长度。（看不懂没关系，看下文分析）

我们上文说到，我们对所有\(STMax[i][0]\)进行赋值，他们的区间长度都是1，最大值都是原数据\(A[i]\)本身。那么我们是不是得到了所有长度为1的区间的最大值？，因此我们可以去求长度为2的区间的最大值。

接下来我来分析前三步。

求长度区间为2的最大值

根据\(max(max([1])，max([2]))\)我们可以得到\([1,2]\)这个长度为2的区间的最大值，同样的，我们能得到\([2,3],[3,4][4,5]...[N-1,N]\)所有长度为2的区间的最大值。

求长度区间为4的最大值

根据上面举的例子，求出\([1,4],[2,5],[3,6]....\)所有长度区间为4的

求长度区间为8的最大值

求出所有长度区间为8，的最大值

...............................................

我们每一步都可以在上一步的基础上得到更大的区间。区间长度不断翻倍增长(不断乘2)，回到我们上面的定义：我们设\(STMax[i][j]\)：从\(i\)开始的区间长度为\(2^j\)的最大值，所以我们在声明数组的大小的时候，第二维的最大值为整个区间的长度的对数。一般我都设置为21（大概\(2^{21}=2e6\)）

声明ST表

int STMax[N][21];

维护ST表的代码如下

仔细看代码，别看到符号就觉得难。\((1<<j)\)代表的是\(2^j\)

    for(int j=1;j<=log(n);j++){//j代表的是区间长度，n代表原数组的长度，区间长度要<=log(n),原因查看j的实际含义。
        for(int i=1;i+(1<<j)-1<=n;i++){//右区间不能越界
            STMax[i][j]=max(STMax[i][j-1],STMax[i+(1<<(j-1))][j-1]);
        }
    }

查询

我们预处理完\(STMax[i][j]\)以后，我们就知道了从任意位置\(i\)开始，区间长度为任意一个2的整数幂的一个区间（\([i,i+2^k-1]\)）的最大值。

不妨问问自己，我们建立这样的数据结构有什么意义呢？

假设，我们现在需要求解[1,4]之间的最大值。

我们可以根据我们的\(STMax[i][j]\)直接求得，其结果为\(STMax[1][2]\)。

但是，如果我们需要求解区间长度为6，\([3,8]\)的最大值，我们该如何是好？

我们不能根据我们建立的\(STMax[i][j]\)直接得到答案。因为我们区间的长度只有2的整数次幂，如果从3开始，让\(j=2,STMax[3][2]\)代表的是\([3,6]\)的最大值，如果我们让\(j=3,STMax[3][3]\)代表的是\([3,10]\)的最大值，明显就超出了我们要求的区间。

我们可以根据上文说到的\(max\)可以相互嵌套的性质。

如果我们求出\([3,6][5,8]\)区间的最大值，然后再取最大值不就是\([3,8]\)区间的最大值了吗?

所以我们的策略是这样，对于\([l,r]\)的区间，即次区间长度为\(le=r-l+1\)，我们可以构建两个长度为\(log_2^{le}\)的相交区间。这个值很巧妙，会确保两个区间之并集一定覆盖整个区间，还请读者细细体会。

因此对于一个区间的查询

int query(int l,int r ){
    int k=log(r-l+1);
    return max(STMax[l][k],STMax[r-(1<<k)+1][k]);
}

我们反复求解\(log(r-l+1)\)也挺浪费时间的，所以我们可以预处理，建立\(log[]\)数组

    for(int i=2;i<N;i++){
        lg[i]=lg[i/2]+1;
    }

算法模板

以洛谷的模板题解完结此篇文章。

模板题

#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int N=1e5+5;
int STMax[N][23];
int lg[N];
int query(int l,int r ){
    int k=lg[r-l+1];
    return max(STMax[l][k],STMax[r-(1<<k)+1][k]);
}

int main() {
    int n,m;
    for(int i=2;i<N;i++){
        lg[i]=lg[i/2]+1;
    }
    scanf("%d%d",&n,&m);
    for(int i=1;i<=n;i++){
        scanf("%d",&STMax[i][0]);
    }
    for(int j=1;j<=log(n);j++){
        for(int i=1;i+(1<<j)-1<=n;i++){
            STMax[i][j]=max(STMax[i][j-1],STMax[i+(1<<(j-1))][j-1]);
        }
    }
    while(m--){
        int l,r;
        scanf("%d%d",&l,&r);
        printf("%d\n",query(l,r));
    }

}

posted @ 2021-08-05 23:48 Fanxuwei 阅读(156) 评论(0) 收藏举报

刷新页面返回顶部

Fanxw

<算法笔记01>ST表

st表

算法介绍

预处理

查询

算法模板

公告