浅谈LCA问题(最近公共祖先)(四种做法)

【模板】最近公共祖先(LCA)

\(update \ 2023.1.3\) 新增了树链剖分

题目描述

如题,给定一棵有根多叉树,请求出指定两个点直接最近的公共祖先。

输入格式

第一行包含三个正整数 \(N,M,S\),分别表示树的结点个数、询问的个数和树根结点的序号。

接下来 \(N-1\) 行每行包含两个正整数 \(x, y\),表示 \(x\) 结点和 \(y\) 结点之间有一条直接连接的边(数据保证可以构成树)。

接下来 \(M\) 行每行包含两个正整数 \(a, b\),表示询问 \(a\) 结点和 \(b\) 结点的最近公共祖先。

输出格式

输出包含 \(M\) 行,每行包含一个正整数,依次为每一个询问的结果。

样例 #1

样例输入 #1

5 5 4
3 1
2 4
5 1
1 4
2 4
3 2
3 5
1 2
4 5

样例输出 #1

4
4
1
4
4

提示

对于 \(30\%\) 的数据,\(N\leq 10\)\(M\leq 10\)

对于 \(70\%\) 的数据,\(N\leq 10000\)\(M\leq 10000\)

对于 \(100\%\) 的数据,\(N\leq 500000\)\(M\leq 500000\)

样例说明:

该树结构如下:

第一次询问:\(2, 4\) 的最近公共祖先,故为 \(4\)

第二次询问:\(3, 2\) 的最近公共祖先,故为 \(4\)

第三次询问:\(3, 5\) 的最近公共祖先,故为 \(1\)

第四次询问:\(1, 2\) 的最近公共祖先,故为 \(4\)

第五次询问:\(4, 5\) 的最近公共祖先,故为 \(4\)

故输出依次为 \(4, 4, 1, 4, 4\)

2021/10/4 数据更新 @fstqwq:应要求加了两组数据卡掉了暴力跳。

浅浅分析一下?

  • 首先,知道最近公共祖先是什么意思

  • 这个节点的父节点,父节点的父节点都是祖先……,甚至自己都是祖先

  • 去看看这个题的样例解释,明白了这个概念后,再看后面。

暴力做法?

  • 不要把算法想的太复杂,说到底,就是暴力的思路,然后想尽办法优化,什么常数优化啊一大堆乱七八糟的。

  • 这道题也是一样,我们来考虑暴力做法

  • 记录一个点的所有祖先,枚举另一个点的祖先,相同输出。

  • 如果出题人故意卡你,给你出一个两条互不相同的链,然后头结点拼起来,然后给你一个查询:两条链的尾结点,你肯定会超时。

倍增

  • 预处理

  • 我们需要知道每个点的祖先,但不需要全部,毕竟空间存不下(具体思路见我RMQ的思路)

  • \(f[i][j]\)表示\(i\)\(2^j\)级祖先是谁

  • \(f[i][0]\)表示\(i\)的父亲…………

  • 状态转移方程:\(f[i][j]=f[f[i][j-1]][j-1]\)

  • 这个怎么记呢?

  • “爸爸的爸爸叫爷爷”

  • 查询

  • 第一步:对齐

  • \(x,y\)深度不一样,不妨设\(x\)的深度\(>y\)的深度

  • 首先令\(x\)爬到\(x\)的某个深度与\(y\)相等的祖先

  • 如果\(y==x\)\(y\)就是\(x\)的祖先,输出\(y\)即可,否则进入下一步

  • 第二步:爬树

  • \(x,y\)以倍增的形式向上爬树,单次查询:\(O({log_{2}}^{n})\)

  • \(dfs\)查询每个节点的\(2^j\)级祖先(这里用的是链式前向星存储)(不会的去查吧

void dfs(int x,int fat)
{
	fa[x][0]=fat;
	deep[x]=deep[fat]+1;//深度等于他爸的深度+1
	for(int i=1;i<=lg[deep[x]];++i)
		fa[x][i]=fa[fa[x][i-1]][i-1];//爸爸的爸爸叫爷爷
	for(int i=head[x];i;i=edge[i].next)
		if(edge[i].to!=fat)//不是父亲
			dfs(edge[i].to,x);//遍历
	}
  • 开始爬树(同一高度)

int LCA(int x,int y)
{
	if(deep[x]<deep[y])
		swap(x,y);//不妨设x深度大于y
		while(deep[x]>deep[y])
			x=fa[x][lg[deep[x]-deep[y]]-1];//RMQ讲过的,log值要减一
	if(x==y)return x;//y是x的祖先
//现在x和y在同一深度上
  • 继续爬树

for(int k=lg[deep[x]]-1;k>=0;k--)//注意遍历顺序
		if(fa[x][k]!=fa[y][k]){//没爬到
			x=fa[x][k];      
			y=fa[y][k];      			
		}
		//也许超了,不往上爬                      
	return fa[x][0];//爬完之后,它肯定在最近公共祖先的儿子,返回他爸                   
	}
  • \(Code:\)

#include<bits/stdc++.h>

using namespace std;
struct node{int to,nxt;}edge[1000005];
int n,m,s,head[1000005],cnt;
int fa[1000005][25],r[1000005],lg[1000005];
void log_2(int k){
	for(int i=1;i<=k;i++)
		lg[i]=lg[i-1]+((1<<lg[i-1])==i);
}
void add(int from,int to){
	edge[++cnt].to=to,edge[cnt].nxt=head[from],head[from]=cnt;
}
void dfs(int u,int fat){//dfs初始化fa数组
	fa[u][0]=fat,r[u]=r[fat]+1;
	for(int i=1;i<lg[r[u]];/*注意-1*/i++) 
		fa[u][i]=fa[fa[u][i-1]][i-1];//爸爸的爸爸叫爷爷
	for(int i=head[u];i;i=edge[i].nxt)
		if(edge[i].to!=fat)
			dfs(edge[i].to,u);
}
int LCA(int x,int y){
	if(r[x]<r[y])swap(x,y);//不妨设x比y深 
	while(r[x]>r[y])
		x=fa[x][lg[r[x]-r[y]]-1];//注意减一 
	if(x==y) return y;//y是x的祖先
	for(int i=lg[r[x]]-1;i>=0;i--){//预好跳完整个数的准备,从大到小,注意减一 
		if(fa[x][i]!=fa[y][i]) x=fa[x][i],y=fa[y][i];//跳
		//不然什么都不干 
	}
	return fa[x][0];//返回他的父亲,自行模拟 
}
int main()
{
	cin>>n>>m>>s;
	for(int i=1;i<n;i++){
		int u,v;scanf("%d %d",&u,&v);
		add(u,v),add(v,u);
	}
	log_2(n);
	dfs(s,0);
	for(int i=1;i<=m;i++){
		int x,y;scanf("%d %d",&x,&y);
		printf("%d\n",LCA(x,y));
	}
	return 0;
}

RMQ

  • 这东西没想出来正常(因为我没有想出来),非常神奇

  • 我们先来了解各个需要用到的数组含义

  • \(ver[i]\)表示\(dfs\)\(i\)个访问的节点

  • \(R[i]\)表示\(ver[i]\)所在的层数,也就是深度

  • \(first[i]\)表示\(i\)个节点在\(ver[i]\)的最小编号,也就是第一个出现的编号

  • 图

  • 如果我们要求\(d\)\(f\)\(LCA\),我们发现\(d\)第一次出现在\(4\)\(f\)第一次出现在\(9\),由\(dfs\)的性质可以知道,在\(4~9\)之间深度最小的点就是\(LCA\)

  • 这不就是区间查询问题吗?

  • 于是我们就想到了\(RMQ\),预处理\(O(n{log_{2}}^n)\),查询:\(O(1)\)非常之快

  • 直接上代码,都讲过(三个数组的预处理都会吧

  • \(Code:\)

//LCA(RMQ方法) 
#include<bits/stdc++.h>

using namespace std;
struct node{int value,nxt,to;}edge[2000005];
int n,m,s,head[1000005],cnt,tot;
int fir[1000005];//每个点第一次出现的时间 
int ver[1000005];//时间戳
int r[1000005];//时间戳每个点的深度 
int f[20][1000005];//RMQ数组(记录深度)
int rec[20][1000005];//记录标号 
int lg[1000005];//log2数组 
void tiao_shi(){
	for(int i=1;i<=tot;i++) cout<<ver[i]<<' ';
	cout<<endl;
	for(int i=1;i<=tot;i++) cout<<r[i]<<' ';
	cout<<endl;
	for(int i=1;i<=n;i++) cout<<fir[i]<<' ';
	cout<<endl;
}
void add(int from,int to){//链式前向星 
	edge[++cnt].to=to,edge[cnt].nxt=head[from],head[from]=cnt;
}
void log_2(int k){
	for(int i=1;i<=k;i++)
		lg[i]=lg[i-1]+(1<<lg[i-1]==i);
}
void dfs(int u,int dep){
	fir[u]=++tot,ver[tot]=u,r[tot]=dep;
	for(int i=head[u];i;i=edge[i].nxt){
		int v=edge[i].to;
		if(!fir[v])
			dfs(v,dep+1),ver[++tot]=u,r[tot]=dep;//去了又,回来 
	}
}
void RMQ_init(){//RMQ初始化,详见RMP模板 
	log_2(tot);//求log2 1~tot比cmath库的函数快很多
	for(int i=1;i<lg[tot];i++)
		for(int j=1;j+(1<<i)-1<=tot;j++)
			f[i][j]=1e9; 
	for(int i=1;i<=tot;i++)//数组初始化 
		f[0][i]=r[i],rec[0][i]=ver[i];
	for(int i=1;i<lg[tot];i++)
		for(int j=1;j+(1<<i)-1<=tot;j++){
			if(f[i-1][j]<f[i-1][j+(1<<i-1)])
				f[i][j]=f[i-1][j],rec[i][j]=rec[i-1][j];
			else f[i][j]=f[i-1][j+(1<<i-1)],rec[i][j]=rec[i-1][j+(1<<i-1)];//聚合 
		}
}
int main()
{
	cin>>n>>m>>s;
	for(int i=1;i<n;i++){
		int u,v;scanf("%d %d",&u,&v);
		add(u,v),add(v,u);
	}
	dfs(s,1);
	RMQ_init();
	for(int i=1;i<=m;i++){
		int l,r;scanf("%d %d",&l,&r);
		l=fir[l],r=fir[r];
		if(l>r)swap(l,r);
		int k=lg[r-l+1]-1;//注意减一  
		if(f[k][l]<f[k][r-(1<<k)+1]) printf("%d\n",rec[k][l]);
		else printf("%d\n",rec[k][r-(1<<k)+1]);
	}
	//详细见RMQ,这里只提供思路 
//	tiao_shi();
	return 0;	
}

tarjan

  • 自认为讲不清楚

  • 推荐一个详解博客:tarjan——LCA

  • 这里说一下简略思路

  • 第一步遍历,\(DFS\)遍历,如果走不下去了,就把那个点用并查集并起来

  • 然后用一个\(vis\)数组标记,如果遍历到一个点,寻找和他有关系的点,如果那个点被标记过了,他们的最近公共祖先就是\(find(那个点)\)

  • 详细请见那个博客,这里给出这个博客给的思路写出来的代码

  • \(Code:\)

#include<bits/stdc++.h>

using namespace std;
struct node{int to,nxt,id;}edge[1000005],deg[1000005];
int n,m,s,cnt,dcnt,head[1000005],dhd[1000005],ict;
int fa[1000005],rak[1000005];//并查集
int vis[1000005];//标记数组 
int ans[1000005];//答案数组 
void add(int from,int to){
	edge[++cnt].to=to,edge[cnt].nxt=head[from],head[from]=cnt;
}
void dadd(int from,int to){
	deg[++dcnt].to=to,deg[dcnt].nxt=dhd[from],dhd[from]=dcnt,deg[dcnt].id=++ict;
	deg[++dcnt].to=from,deg[dcnt].nxt=dhd[to],dhd[to]=dcnt,deg[dcnt].id=ict;
}
void init(){
	for(int i=1;i<=n;i++) fa[i]=i;
}
int find(int x){
	if(x==fa[x]) return x;
	return fa[x]=find(fa[x]);//小优化 
}
void marge(int u,int v){//不能用按秩合并,有顺序的限定! 
	int f1=find(u),f2=find(v);
	fa[f2]=f1;
}
void tarjan(int u,int fat){
	vis[u]=1;
	for(int i=head[u];i;i=edge[i].nxt)
		if(!vis[edge[i].to]&&edge[i].to!=fat)//并查集挺高查找速度 
			tarjan(edge[i].to,u),marge(u,edge[i].to);
	for(int i=dhd[u];i;i=deg[i].nxt)
		if(vis[deg[i].to]&&!ans[deg[i].id])
			ans[deg[i].id]=find(deg[i].to);
}
int main()
{
	cin>>n>>m>>s;
	for(int i=1;i<n;i++){
		int u,v;cin>>u>>v;
		add(u,v),add(v,u);
	}
	for(int i=1;i<=m;i++){
		 int x,y;cin>>x>>y;
		 dadd(x,y);
	}
	init();
	tarjan(s,0);
	for(int i=1;i<=ict;i++) cout<<ans[i]<<endl;
	return 0;
}

树链剖分

  • 个人认为树剖是倍增的另一种优化形式

  • 倍增是使用\(ST\)表这一神奇东西优化

  • 而树剖就是将一棵树分成若干条链,进而减少跳树的过程

  • 而怎么将一棵树分成几条链呢?

  • 先看看下面一些元素的定义

  1. 重儿子:指的是以这棵树的儿子为根的子树元素最多的儿子
    不理解?
    看看这张图
    在这里插入图片描述
    节点\(1\)\(2\)个儿子,分别是节点\(2\)和节点\(3\),以\(2\)根的子树的元素数量为\(1\)(就他自己)(为了方便,以\(x\)为分根的子树的元素数量为\(size_x\)
    \(size_3=2\),所以元素\(1\)的重儿子是\(3\)

2.有重儿子自然也有轻儿子,轻儿子就是父节点除了重儿子以外的儿子,很好理解吧
3.重边:父节点与重儿子的连线
4.轻边:父节点与轻儿子的连线
5.重链:多条重边组成的链
6.轻链:多条轻边组成的链
来自一篇博客
比如上面的图,黑色粗边组成的链子就是重链,其他是轻链
注意:标有红色点的是每条重链的起点

  • 好啦,以上就是一些基础元素,如果你学到这里全部理解,那么下面的实现肯定难不倒你捏

  • 回到正题,首先我们肯定要建链(不准确学名),我们首先先把整个树建出来并且把每个点的重儿子找出来

int f[MAXN], d[MAXN], son[MAXN], size[MAXN];
//f[i]是i的父亲
//d[i]是i的深度
//son[i]是i的重儿子
//size[i]是以i为根的子树的元素总和
void dfs1(int u, int fa, int depth) {//u:现在的点,fa:字面意思,depth:字面意思
	f[u] = fa, d[u] = depth, size[u] = 1;//附初值
	for (int i = head[u]; i; i = edge[i].nxt) {
		int v = edge[i].to;
		if(f[u] == v) continue;
		dfs1(v, u, depth + 1);
		size[u] += size[v];//要先递归,此时size[v]是求出来的
		if(size[v] > size[son[u]]) son[u] = v;//求重儿子
	}
}
  • 接下来,我们就可以正儿八经的建链啦
int top[MAXN], id[MAXN], rt[MAXN], l_cnt;
//top[i]表示i所在的链的链头,即上文图片中打红色点的节点
//id[i],rt[i],l_cnt求和用的,这里先不讲
void dfs2(int u, int t) {
	top[u] = t, id[u] = ++l_cnt, rt[l_cnt] = u;
	if(!son[u]) return ;//叶子节点return掉
	dfs2(son[u], t);//要想清楚,一条重链的节点都是重儿子,所以这条链的top还是原来的top
	for (int i = head[u]; i; i = edge[i].nxt) {
		int v = edge[i].to;
		if(v != son[u] && v != f[u]) //处理轻儿子
			dfs2(v, v);//轻儿子的链头是自己啦
	} 
}
  • 建完链之后我们就可以求\(LCA\)

  • 具体做法就是让两个点条到一条链上,然后高的那个点(也有可能一样高)就是公共祖先啦

int LCA(int x, int y) {
	while(top[x] != top[y]) {
		if(d[top[x]] < d[top[y]]) swap(x, y);//不妨设d[x]大于d[y]
		x = f[top[x]];//跳到链头的父亲那,也就是比他高一级的链的末尾
	}
	if(d[x] > d[y]) swap(x, y);
	return x;//高的那个点就是公共祖先
}
  • 这道题到这里就结束了,配上高清无码代码

\(\mathcal{Code}\)

#include<bits/stdc++.h>

using namespace std;
const int MAXN = 5e5 + 7;

struct node{int nxt, to;}edge[2 * MAXN];
int cnt, head[MAXN];
inline void add(int front, int to) {edge[++cnt].to = to, edge[cnt].nxt = head[front], head[front] = cnt;}

int f[MAXN], d[MAXN], son[MAXN], size[MAXN];
void dfs1(int u, int fa, int depth) {
	f[u] = fa, d[u] = depth, size[u] = 1;
	for (int i = head[u]; i; i = edge[i].nxt) {
		int v = edge[i].to;
		if(f[u] == v) continue;
		dfs1(v, u, depth + 1);
		size[u] += size[v];
		if(size[v] > size[son[u]]) son[u] = v;
	}
}
int top[MAXN], id[MAXN], rt[MAXN], l_cnt;
void dfs2(int u, int t) {
	top[u] = t, id[u] = ++l_cnt, rt[l_cnt] = u;
	if(!son[u]) return ;
	dfs2(son[u], t);
	for (int i = head[u]; i; i = edge[i].nxt) {
		int v = edge[i].to;
		if(v != son[u] && v != f[u]) 
			dfs2(v, v);
	} 
}
int LCA(int x, int y) {
	while(top[x] != top[y]) {
		if(d[top[x]] < d[top[y]]) swap(x, y);
		x = f[top[x]];
	}
	if(d[x] > d[y]) swap(x, y);
	return x;
}
 
int N, M, S, x, y, a, b;

int main() {
	ios::sync_with_stdio(false);
	cin.tie(0); cout.tie(0);
	
	cin >> N >> M >> S;
	for (int i = 1; i < N; i++) {
		cin >> x >> y;
		add(x, y), add(y, x);
	}
	
	dfs1(S, 0, 1);
	dfs2(S, S);
	for (int i = 1; i <= M; i++) {
		cin >> a >> b;
		cout << LCA(a, b) << endl;
	}
	return 0;
}

大家可以用这道题练练手。
熟能生巧,\(NOI\)路上也是如此,加油啊!童鞋们

posted @ 2023-01-12 16:14  Phrvth  阅读(282)  评论(0)    收藏  举报