LCA和RMQ的一些事情

推荐技术公众号：不爱睡觉的大猪

本来想详细写写LCA和RMQ的东西的，但是觉得积累得还不够而且比较懒就不写了。鉴于都是超经典问题，网上和大量书籍都是很好的学习材料，所以就不想说了

这里只简单说说原理，说说代码实现上面的一些细节和注意问题，并且给出模板

下面写提供几个学习LCA和RMQ的博客，都很通熟易懂，向博主致敬

http://dongxicheng.org/structure/lca-rmq/

这个应该是讲得最好的，且博主还有很多其他文章，可以读读，感觉认真读了这篇，都不太需要看别的资料了，百度和谷歌搜索的第一位都是他，好东西大家一起学习

http://scturtle.is-programmer.com/posts/30055

这个博客讲LCA的Tarjan算法个人觉得是比较好的，我看这篇文章，看了1个小时就搞懂了LCA的Tarjan，谢谢博主。可以认真阅读，并且看懂里面附带的那个图

其余的博客，就请百度和谷歌了，能找到很多，都很好

一：LCA和RMQ是可以相互转化的

往往都只是提到了LCA可以转化为RMQ去求解，其实RMQ也能转化为LCA去求解，RMQ怎么转LCA，可以看2007年的国家队论文，里面有介绍，非常好懂。不过个人觉得，RMQ转LCA，可以学习这个思想，但是实际应用中最好不要，多此一举的感觉，求解RMQ的算法很多，不必要用LCA去求解

所以下面讲讲LCA转RMQ的实现方法（只讲实现方法，具体的原理不讲，可以看书百度，不过看了实现过程，原理大概也懂了）

LCA转RMQ算法是一个在线算法：先用时间去做预处理，然后每读入一个询问，就用很短的时间去回答它，即”问一个答一个，回答时间很短“

预备知识：LCA转为RMQ后，几乎是裸的RMQ问题，RMQ问题，这里推荐ST算法求解，如果不懂ST算法，先学习一下

————————————————————————————————————————————————————————————

二：LCA的Tarjan算法

Tarjan算法是个离线算法：即先把所有询问保存下来，但是不回答（也回答不了），重新组织这些询问，然后再回答，但是回答的顺序，不一定是询问的顺序，即”一口气问完，处理完，再一口气回答“。如果一定要你按照询问的顺序得出答案，那么还要稍微处理一下

说说感悟：很多人说Tarjan算法强调递推的性质，我个人感觉说递推不够直接，应该说是强调时间，先后顺序。学了Tarjan几个算法，都有时间戳这个概念，这个算法里没强调这个，但是有这个意思。它定义了一个概念，什么叫处理完的节点，就是这个节点被访问了且它下面的所有子树的所有节点都被访问了，就认为这个节点是处理完了，由于是前序遍历这棵树，所以节点被处理，是有个先后顺序的，我们知道Tarjan在处理完一个节点后，就看看这个节点涉及了哪些询问，看看呗询问的另一个点是否也是被处理完的，如果另一个点也是被处理完的，那么这个询问可以被回答，否则，现在还不能回答，要等下再回答，什么时候回答，就是等到那个节点也被处理完的时候。

说说代码实现上的问题

如果理解了Tarjan，写出那个核心的dfs遍历反而不难，有时候纠结的是怎么保存询问的答案，并且按照询问的顺序，还原出答案

首先，我们是先把询问拆成两份，例如询问x和y的lca，拆成x和y的lca ， y和x的lca，两者是完全相同的，等价的

对于一系列询问

1 2

1 3

2 3

3 4

变为

1 2

2 1

1 3

3 1

2 3

3 2

3 4

4 3

然后保存，保存方式是用邻接表（个人感觉这种方法比较好，可以用上位运算，记录的东西也比较少）。保存在一个表中，表的下标从0开始标号

对已表中的第k项，例如 2 3 ，那么k^1项和k项的LCA是相同的，所以就可以保存 a[k].lca = a[k^1].lca = ans

最后注意一点，Tarjan的伪代码可以很好帮助理解算法本质，注意里面一个并查集合并的操作Union(x,y)。这个Union(x,y)有好多写法，其中最简单的就是一个语句（个人推荐这种），这个Union的写法会稍微影响到dfs函数里面的写法（不影响算法本质，只是影响写法）

具体看模板

LCA转RMQ的模板

const int N = 40010;
const int M = 25;

int _pow[M];     //事先保存2^x，不必重复计算
int head[N];     //邻接表表头
int ver[2*N];    //保存遍历的节点序列，长度为2n-1，从下标1开始保存
int R[2*N];      //和遍历序列对应的节点深度数组，长度为2n-1，从下标1开始保存
int first[N];    //每个节点在遍历序列中第一次出现的位置
int dir[N];      //保存每个点到树根的距离，很多问题中树边都有权值，会询问两点间的距离，如果树边没权值，相当于权值为1
int dp[2*N][M];  //这个数组记得开到2*N，因为遍历后序列长度为2*n-1
bool vis[N];     //遍历时的标记数组
int tot;
struct edge //保存边，数组大小至少为2*n
{
    int u,v,w,next;
}e[2*N];

void dfs(int u ,int dep) //遍历树，过程中顺便做了好多事情
{
    vis[u] = true; ver[++tot] = u; first[u] = tot; R[tot] = dep;
    for(int k=head[u]; k!=-1; k=e[k].next)
        if( !vis[e[k].v] )
        {
            int v = e[k].v , w = e[k].w;
            dir[v] = dir[u] + w;
            dfs(v,dep+1);
            ver[++tot] = u; R[tot] = dep;
        }
}

int RMQ(int x ,int y) //这个询问仅仅是返回一个位置，即LCA所在序列数组的位置，ver[res]才是LCA的标号
{
    int K = (int)(log((double)(y-x+1)) / log(2.0));
    int a = dp[x][K] , b = dp[y-_pow[K]+1][K];
    if(R[a] < R[b]) return a;
    else            return b;
}

int LCA(int u ,int v)  //返回点u和点v的LCA
{
    int x = first[u] , y = first[v];
    if(x > y) swap(x,y);
    int res = RMQ(x,y);
    return ver[res];
}


//  lcaxy = LCA(x,y);
//  lcaab = LCA(a,b);

Tarjand的伪代码

void Tarjan(int u)
{
    vis[u] = true;
    Make-Set(u); //以点u自己为代表元素建立一个集合，此时集合也只有它自己一个元素
    ance[Find(u)] = u; //记录点u所在的那个集合的祖先是u自己，其实此时还是只有它自己
    for(u的所有儿子v)
        if(该儿子v没有被访问)
        {
            Tarjan(v);
            Union(u,v); //将儿子v所在集合并在点u所在的集合，点u已经是集合的代表元素
            ance[Find(u)] = u; //确保点u所在的集合的祖先是u自己
        }
    colour[u] = true;   //这个点u认为已经处理完
    for(u的所有儿子v)
        if( colour[v] )  //儿子v也被处理完
            LCA(u,v) = LCA(v,u) = ance[Find(v)];  //两者的LCA此时可以回答了，就是儿子v所在的集合的祖先
}

Tarjan模板

using namespace std;
const int N = 40010;
const int M = 410;

int head[N];            //树边邻接表的表头
int __head[N];          //保存询问的邻接表的表头
struct edge{            //保存边
    int u,v,w,next;
}e[2*N];
struct ask{            //保存询问
    int u,v,lca,next;
}ea[M];
int dir[N];              //保存点到树根的距离
int fa[N];               //并查集，保存集合的代表元素
int ance[N];             //保存集合的组合，注意对象是集合而不是元素
bool vis[N];             //遍历时的标记数组

inline void add_edge(int u,int v,int w,int &k) //保存边
{
    e[k].u = u; e[k].v = v; e[k].w = w;
    e[k].next = head[u]; head[u] = k++;
    u = u^v; v = u^v; u = u^v;
    e[k].u = u; e[k].v = v; e[k].w = w;
    e[k].next = head[u]; head[u] = k++;
}

inline void add_ask(int u ,int v ,int &k) //保存询问
{
    ea[k].u = u; ea[k].v = v; ea[k].lca = -1;
    ea[k].next = __head[u]; __head[u] = k++;
    u = u^v; v = u^v; u = u^v;
    ea[k].u = u; ea[k].v = v; ea[k].lca = -1;
    ea[k].next = __head[u]; __head[u] = k++;
}

int Find(int x)
{
    return x == fa[x] ? x : fa[x] = Find(fa[x]);
}
void Union(int u ,int v)
{
    fa[v] = fa[u];  //可写为  fa[Find(v)] = fa[u];
}

void Tarjan(int u)
{
    vis[u] = true;
    ance[u] = fa[u] = u; //可写为 ance[Find(u)] = fa[u] = u;
    for(int k=head[u]; k!=-1; k=e[k].next)
        if( !vis[e[k].v] )
        {
            int v = e[k].v , w = e[k].w;
            dir[v] = dir[u] + w;
            Tarjan(v);
            Union(u,v);
            ance[Find(u)] = u;  //可写为ance[u] = u;  //甚至不要这个语句都行
        }
    for(int k=__head[u]; k!=-1; k=ea[k].next)
        if( vis[ea[k].v] )
        {
            int v = ea[k].v;
            ea[k].lca = ea[k^1].lca = ance[Find(v)];
        }
}

int main()
{
    //.............省略..............
    memset(head,-1,sizeof(head));
    memset(__head,-1,sizeof(__head));
    tot = 0;
    for(int i=1; i<n; i++)  //建树
    {
        int u,v,w;
        scanf("%d%d%d",&u,&v,&w);
        add_edge(u,v,w,tot);
    }
    tot = 0;
    for(int i=0; i<q; i++) //拆开保存询问
    {
        int u,v;
        scanf("%d%d",&u,&v);
        add_ask(u,v,tot);
    }
    memset(vis,0,sizeof(vis));
    dir[1] = 0;
    Tarjan(1);
    for(int i=0; i<q; i++)
    {
        int s = i * 2 , u = ea[s].u , v = ea[s].v , lca = ea[s].lca;
        //已经按顺序取出了询问和答案，lca = LCA(u,v)
    }
    return 0;
}

posted @ 2013-05-26 23:53 Titanium 阅读(8814) 评论(1) 收藏举报

刷新页面返回顶部

Titanium

LCA和RMQ的一些事情

公告