把博客园图标替换成自己的图标
把博客园图标替换成自己的图标end

可持久化专题(一)——浅谈主席树:可持久化线段树

前言

不得不说,可持久化数据结构真是太难了!

由于数据结构这东西真的太玄学了,学这个主席树我真的学了很久。

简介

主席树为什么叫主席树?据说因为它是一个名字缩写为\(HJT\)的神犇发明的,与当时主席的名字缩写一样......

主席树实质上就是一棵可持久化线段树,它的具体实现可以看下面。

让我们从值域线段树开始说起

要学主席树,我们就要先学值域线段树

值域线段树的区间存的并不是节点信息,而是在值在某一范围内的数的个数

如图就是一棵值域线段树,其中1号节点存储的是大于等于1小于等于4的数字个数,2号节点存储的是大于等于1小于等于2的数字个数,3号节点存储的是大于等于3小于等于4的数字个数,4号节点存储的是等于1的数字个数,5号节点存储的是等于2的数字个数,6号节点存储的是等于3的数字个数,7号节点存储的是等于4的数字个数。

值域线段树的查询也挺简单的,若要查询这段区间内的第\(k\)大,只要比较当前元素的左子树大小加1(1是当前元素本身的大小)与询问的\(k\),若大于等于,就访问左子树,否则将\(k\)减去当前元素的左子树大小加1,然后访问右子树。

这和平衡树有什么区别!!!

还有一个问题,就是值域线段树存储的区间范围是固定的,所以如果要查询区间第\(k\)大,我们就不能只用一棵值域线段树。

考虑建\(n\)棵值域线段树,每棵值域线段树存储区间\([1,i]\)的信息,这样一来,要查询\([l,r]\)的第\(k\)大时,只要在查询的过程中,将第\(r\)棵值域线段树的信息减去第\(l-1\)棵值域线段树的信息即可,这利用了前缀和的思想。

或许你会问,这有什么用?建\(n\)棵树,内存那么大,我平衡树第一个不服!

好吧,不服就不服,值域线段树还是有点用的,因为平衡树没法可持久化啊(可持久化\(Treap\)请走开)!

从值域线段树到主席树

知道了值域线段树,我们就可以开始尝试实现主席树了。

来研究一下下面两棵分别存储\([1,3]\)\([1,4]\)区间信息的值域线段树(圆圈中为以该节点为根的子树大小)。

仔细观察可得,我们每次新加入一个节点,有影响的只有图中\(\color{red}{标红}\)的节点。

再仔细观察一下,这些节点都在一条链上(废话)。

那么,我们就会有一个大胆的想法:可不可以每次只新建一条链而不是一棵树,就像下面这样?

这就是传说中的主席树了。

主席树的具体实现

当然,真正实现主席树时,还是有一些细节要注意的。

这里就不多讲了,直接上代码吧:(洛谷板子题

#include<bits/stdc++.h>
#define max(x,y) ((x)>(y)?(x):(y))
#define min(x,y) ((x)<(y)?(x):(y))
#define LL long long
#define swap(x,y) (x^=y,y^=x,x^=y)
#define tc() (A==B&&(B=(A=ff)+fread(ff,1,100000,stdin),A==B)?EOF:*A++)
#define pc(ch) (pp_<100000?pp[pp_++]=(ch):(fwrite(pp,1,100000,stdout),pp[(pp_=0)++]=(ch)))
#define N 200000 
int pp_=0;char ff[100000],*A=ff,*B=ff,pp[100000];
using namespace std;
int n,Q,m,tot=0,rt[N+5],a[N+5],p[N+5];
struct Chairman_Tree
{
    int Son[2],Size;
}node[N<<6];
inline void read(int &x)
{
    x=0;int f=1;char ch;
    while(!isdigit(ch=tc())) f=ch^'-'?1:-1;
    while(x=(x<<3)+(x<<1)+ch-'0',isdigit(ch=tc()));
    x*=f;
}
inline void write(int x)
{
    if(x<0) pc('-'),x=-x;
    if(x>9) write(x/10);
    pc(x%10+'0');
}
inline void Build(int &rt,int l,int r)//建出一棵初始时的的树,和传统的线段树几乎一样
{
    rt=++tot;//新建一个节点,动态开点也是主席树中特别重要的
    int mid=l+r>>1;
    if(!(l^r)) return;
    Build(node[rt].Son[0],l,mid),Build(node[rt].Son[1],mid+1,r);//分别建树
}
inline void NewPoint(int &rt,int lst,int l,int r,int val)//新建一个节点(准确来说,应该是新建一条链)
{
    node[rt=++tot]=node[lst],++node[rt].Size;//动态开点,先复制原先的节点,然后将子树大小加1
    int mid=l+r>>1;
    if(!(l^r)) return;
    if(val<=mid) NewPoint(node[rt].Son[0],node[lst].Son[0],l,mid,val);//如果插入的新值比当前元素小(或等于),那么就新建一个左儿子
    else NewPoint(node[rt].Son[1],node[lst].Son[1],mid+1,r,val);//否则,新建一个右儿子
}
inline int Query(int rt1,int rt2,int l,int r,int k)//区间查询,相当于同时在两棵值域线段树上询问
{
    int mid=l+r>>1;
    if(!(l^r)) return l;//如果l与r相等,就返回l
    if(node[node[rt2].Son[0]].Size-node[node[rt1].Son[0]].Size>=k) return Query(node[rt1].Son[0],node[rt2].Son[0],l,mid,k);//如果当前左子树大小加1大于等于询问的k,那么访问左子树
	else return Query(node[rt1].Son[1],node[rt2].Son[1],mid+1,r,k-node[node[rt2].Son[0]].Size+node[node[rt1].Son[0]].Size);//否则,将k减去当前左子树大小加1
}
inline int num(int x)//求出一个数离散化后的值,一个二分的过程
{
    int l=1,r=m;
    while(l<=r)
    {
        int mid=l+r>>1;
        if(p[mid]==x) return mid;
        else if(p[mid]>x) r=mid-1;
        else l=mid+1;
    }
}
int main()
{
    register int i;
    for(read(n),read(Q),i=1;i<=n;++i) read(a[i]),p[i]=a[i];
    for(sort(p+1,p+n+1),Build(rt[0],i=1,m=unique(p+1,p+n+1)-p-1);i<=n;++i) NewPoint(rt[i],rt[i-1],1,m,num(a[i]));//将元素离散化,新建一棵树以及n条链,注意存储每条链的根节点的编号
    for(i=1;i<=Q;++i)//询问
    {
        int x,y,k;
        read(x),read(y),read(k),write(p[Query(rt[x-1],rt[y],1,m,k)]),pc('\n');//利用前缀和思想
    }
    return fwrite(pp,1,pp_,stdout),0;
}
posted @ 2018-10-28 14:29  TheLostWeak  阅读(2396)  评论(1编辑  收藏  举报