Tarjan算法及其应用总结+详细讲解+详细代码注释

\(\text{Tarjan}\)

1.引入概念

1.强连通分量

1.定义

在有向图 \(G\) 中，强连通分量就是满足以下条件的 \(G\) 的子图：

从任意一点出发，都有到达另一个点的路径。
不存在一个或者几个点，使得这个子图加入这些点后，这个子图还满足上一个性质。

为什么要限定”在有向图中“而不是”在任何一个图中“？这是因为在无向图中，只要图连通，那么任意一点都有到另外一点的路径，可以用并查集维护，这个时候 \(\text{Tarjan}\) 就没有存在的必要了。

当然，后面 \(\text{Tarjan}\) 会有在无向图中的用处。

2.性质

我们想一想，一个强连通分量中，既然每一个点都有到达另外一个点的路径，那么对于这个强连通分量中的任意一条边 \(u\rightarrow v\) 的两个端点来说，都存在 \(v\) 到 \(u\) 的路径，那么这个强连通分量一定在一个”大环“上。

当然了，这个”大环”不是严格意义上的环，它可以经过重复的点，就像这样：

这个图告诉了我们什么？一个强连通分量要么是一个大环，要么是由几个有交点的小环组成的。

后面的讲解中，我们会反复提到“大环”，请注意这个概念。“大环”表示一个子图中，从任意一个点出发，不重不漏地经过每条边一次，最后能够回到这个点。“大环”和强连通分量、环的关系是这样的：环 \(\subsetneq\) “大环”，“大环” \(\subsetneq\) 强连通分量。

2.时间戳

1.定义

按照 \(\text{DFS}\) 遍历的过程，以每个结点第一次被访问时的顺序，依次给 \(n\) 个结点标上 \(1\sim n\) 的标记，那么这个标记就叫做时间戳，记作 \(dfn\)。

2.作用

这个在讲 \(\text{Tarjan}\) 的缩点算法逻辑的时候会讲到。

3.边的分类

1.深度优先树的定义

我们在执行 \(\text{DFS}\) 算法的时候，会经过 \(n-1\) 条边和所有 \(n\) 个点，这些边和点会构成一棵树，叫做深度优先树。

就比如下面这个图，它的深度优先树就是红色边：

这里说明一个事情：本篇中所有形如 “\(u\) 的子树”的描述，都包括 \(u\) 本身，除非特殊说明。以及，所有形如“\(u\) 的祖先”的描述，都包括 \(u\) 本身，除非特殊说明。

2.边的分类

树边：指深度优先树中的边。

后向边：在一棵深度优先树中，从一个点 \(u\) 出发，连接到其祖先 \(anc\) 的边，这里可能有 \(anc=u\)。

前向边：在一棵深度优先树中，从一个点 \(u\) 出发，连接到其子树中一个点 \(v\) 的边，这里不可能有 \(v=u\)。

横叉边：指其它所有的边。

4.割点、点双连通、割边、边双连通

1.定义

在一个图 \(G\) 中：

割点：删去一个点 \(u\) 及所有与 \(u\) 相关的边，图就不连通了，那么 \(u\) 称为 \(G\) 的割点。

点双连通：图中没有割点，就说 \(G\) 是点双连通的。

割边：删去一条边 \(e\) 后，图就不连通了，那么称 \(e\) 为 \(G\) 的割边。

边双连通：图中没有割边，就说 \(G\) 是边双连通的。

2.性质

割点、割边都是无向图中的概念。

一个图的割点不止一个，这就是 \(\text{Tarjan}\) 算法存在于无向图中的意义。

如果一条边 \(e=u\rightarrow v\) 是割边，那么 \(u\) 和 \(v\) 是割点。

5.链和最大半连通子图

1.定义

链，顾名思义，它就跟链一样，是一条。任何一条路径都可以认为是一条链。

而最长链，就是经过点最多的链。

最大半连通子图，就是对于一个 \(G\) 的子图 \(G'\) 而言，如果对于 \(G'\) 中的任意两个点 \(u\) 和 \(v\)，都存在 \(u\) 到 \(v\) 的路径或存在 \(v\) 到 \(u\) 的路径，则说这个子图 \(G'\) 就是 \(G\) 的半连通子图。

而最大半连通子图就是 \(G\) 的所有半连通子图中包含点最多的那个。

2.性质

我们想对于一条链 \(u_1\rightarrow u_2\rightarrow u_3\rightarrow\dots\rightarrow u_n\) 而言，其是不是一个半连通子图呢？肯定是的，因为对于任意两个点 \(u_i\) 和 \(u_j\)，如果 \(i>j\)，就存在一条 \(u_j\) 到 \(u_i\) 的路径；否则就有一条 \(u_i\) 到 \(u_j\) 的路径。

那么，最大半连通子图中是否存在一个包括所有点的链呢？这也是肯定的，否则不可能存在半连通。

2.\(\text{Tarjan}\) 的缩点算法逻辑

1.定义

\(\text{Tarjan}\) 的经典用处就是拿来缩点。

首先，我们需要了解为什么要缩点。在一个强连通分量中，每个点都可以互相到达，那么这个强连通分量就可以缩成一个点，每个强连通分量的子问题内部处理。这就是缩点的原因。

2.不同类型的边在强连通分量中的作用

树边：以下的讨论都是基于树边展开的。

后向边：十分有用。一条后向边 \(u\rightarrow anc\) 可以和深度优先树上 \(anc\) 到 \(u\) 的路径形成一个环，而环上每个点都是可以互相到达的。

前向边：没啥用。因为其不能构成环，对缩点没有帮助。

横叉边：部分有用。对于一条横叉边 \(u\rightarrow v\) 而言，如果有一条路径，从 \(v\) 出发，到达一个点 \(anc\)，而这个 \(anc\) 又恰好是 \(u\) 的祖先结点，那么 \(u\rightarrow v\) 这条边就在一个环上了。

3.主算法逻辑

看了上面，你应该就知道 \(\text{Tarjan}\) 要干嘛了。它的作用，就是对于每一个点 \(u\)，找到与 \(u\) 能够构成”大环“的所有结点。

那么怎么找？前面说过，”大环“只能由三种边构成，树边、后向边和横叉边。为了找到通过“后向边”和“横叉边”构成的环，\(\text{Tarjan}\) 算法在 \(\text{DFS}\) 的过程中维护了一个栈。

当访问到某一个点 \(u\) 的时候，栈中需要保留以下两类结点：

深度优先树上 \(u\) 的祖先结点。这是为了维护后向边。
已经访问过，且存在一条路径到达 \(u\) 的祖先结点的结点。这是为了维护横叉边。

一句话概括，就是能够到达 \(u\) 且已经访问过的结点。

我们想想，对于一个在栈中的点 \(t\)，什么情况下，\(u\) 和 \(t\) 才会同在一个”大环“上？一定要有一条 \(u\rightarrow t\) 的边才行吗？不是的，只要有一条 \(u\rightarrow t\) 的路径就可以了。什么时候才会有一条 \(u\rightarrow t\) 的路径？

对于所有从 \(u\) 出发的边 \(u\rightarrow v\)，有两种情况：

\(v\) 没有被访问过。这说明 \(v\) 在 \(u\) 的子树中，\(u\rightarrow v\) 这条边是树边。只要 \(v\) 的子树中有一条边连向 \(t\)，说明 \(u,v,t\) 在一个“大环”上。
\(v\) 被访问过。如果 \(v\) 不在栈中，那么这条边并没有什么用处；否则 \(u,v,t\) 在一个“大环”上。

问题似乎已经解决了，不是吗？我们知道什么情况下 \(u,v,t\) 在一个大环上。那这要怎么写进代码呢？

注意，我们的思路已经完成，下面的一切定义和概念，都不是思路里面本身就存在的，只是为了实现代码方便。

我们定义一个追溯值 \(low\)，那么对于一个结点 \(u\)，其追溯值 \(low_u\) 定义为满足以下条件结点 \(v\) 的最小时间戳：

\(v\) 在栈中。
存在一条从 \(u\) 的子树出发的边，以 \(v\) 为终点。

接下来就彻底到代码部分了。

4.代码逻辑

首先，日常敲一个空壳。

void Tarjan(int u){
    
}

接下来，我们既然已经访问到 \(u\) 这个结点了，当然要把 \(u\) 入栈，并且初始化 \(u\) 的 \(dfn\) 和 \(low\)。

void Tarjan(int u){
    low[u]=dfn[u]=++tim;//tim表示访问到的时间
	stk[++tp]=u;//用数组模拟栈
	vis[u]=true;//vis[u]表示u是否在栈中
}

初始化完了，我们应该进入到主算法部分。回头再看看主算法逻辑，你会发现主算法的核心就是扫描每一条边，后面的任何处理都只跟边有关。我用的是 \(\texttt{vector}\) 存图，看不惯的同学可以看注释了解一下什么意思。

void Tarjan(int u){
	low[u]=dfn[u]=++tim;//tim表示访问到的时间
	stk[++tp]=u;//用数组模拟栈
	vis[u]=true;//vis[u]表示u是否在栈中
	for(int v:g[u]){//扫描每一条从u出发到v结束的边
		
	}
}

我们的主算法逻辑中，边是不是分两种？我们先来讨论第一种，也就是 \(v\) 没有被访问过的情况。

void Tarjan(int u){
	low[u]=dfn[u]=++tim;//tim表示访问到的时间
	stk[++tp]=u;//用数组模拟栈
	vis[u]=true;//vis[u]表示u是否在栈中
	for(int v:g[u]){//扫描每一条从u出发到v结束的边
		if(!dfn[v]){//v还没有被访问过
			Tarjan(v);//扫描v的子树
		}
	}
}

扫描完了 \(v\) 的子树，总不能对 \(u\) 啥都不干吧？我们想想 \(low\) 值此时该怎么更新。

由于 \(v\) 的子树一定是 \(u\) 的子树，所以 \(low_u=\min(low_u,low_v)\)。

void Tarjan(int u){
	low[u]=dfn[u]=++tim;//tim表示访问到的时间
	stk[++tp]=u;//用数组模拟栈
	vis[u]=true;//vis[u]表示u是否在栈中
	for(int v:g[u]){//扫描每一条从u出发到v结束的边
		if(!dfn[v]){//v还没有被访问过
			Tarjan(v);//扫描v的子树
			low[u]=min(low[u],low[v]);//更新u的low值
		}
	}
}

那么我们现在来讨论第二种情况，也就是 \(v\) 被访问且 \(v\) 在栈中。这种情况下，这个结点 \(v\) 满足“存在一条从 \(u\) 出发的边，以 \(v\) 为终点”，所以更新。

void Tarjan(int u){
	low[u]=dfn[u]=++tim;//tim表示访问到的时间
	stk[++tp]=u;//用数组模拟栈
	vis[u]=true;//vis[u]表示u是否在栈中
	for(int v:g[u]){//扫描每一条从u出发到v结束的边
		if(!dfn[v]){//v还没有被访问过
			Tarjan(v);//扫描v的子树
			low[u]=min(low[u],low[v]);//更新u的low值
		}
		else if(vis[v]){//v被访问过且在栈中
			low[u]=min(low[u],dfn[v]);//更新u的low值
		}
	}
}

这个时候“是否在一个强连通分量中”已经判完了，但是我们总是要用一个点来代表一个强连通分量的呀，并不是每个点都有资格代表一个强连通分量的。

注意到之前没有自主的出栈操作，也就是说，else if(vis[v])这一块可能存在前向、后向、横叉三种边。

对于前向边 \(u\rightarrow v\)，\(dfn_v>dfn_u\) 恒成立，所以 \(low_u\) 不会更新。

对于后向边 \(u\rightarrow v\)，\(dfn_v<dfn_u\) 恒成立，所以 \(low_u\) 可能更新。

对于横叉边 \(u\rightarrow v\)，由于“\(v\) 被访问过且在栈中”，所以 \(v\) 比 \(u\) 先访问，所以 \(dfn_v<dfn_u\) 恒成立，\(low_u\) 可能更新。

我们要找到一个点“能够代表一个强连通分量”，这个点应该满足什么性质？当然是以它出发的边中，既无横叉边，又无后向边。这样的点在每一个强连通分量中只有一个，所以具有代表性。

下证为什么这样的点在每一个强连通分量中只有一个，懂得的同学可以不看。

很简单，如果有两个，以其中一个为祖先开始沿深度优先树 \(\text{DFS}\) 遍历，另一个点是连不回来的，没有向回的路径，也就是说这两个点不是能互相到达的。与“强连通分量”矛盾，舍。

这里就体现了 \(low\) 数组的作用了。什么情况下，以一个点 \(u\) 出发的边中，既无横叉边，又无后向边？只有 \(low_u=dfn_u\) 的时候。

在栈中，这个点 \(u\) 到栈顶的所有点都能构成一个“强连通分量”。也就是说，当且仅当 \(dfn_u=low_u\) 的时候，我们才把 \(u\) 以上的所有点出栈，使它们构成一个强连通分量。

为什么这样是对的？因为栈中从 \(u\) 到栈顶所有点，除 \(u\) 以外，都是有横叉边或者后向边的。也正因为如此，它们才会被压在栈中。

现在 \(u\) 出现了，它可以代表一个强连通分量，于是栈中所有点都找到了自己的“归属”。

于是，至此 \(\text{Tarjan}\) 缩点功德圆满。

void Tarjan(int u){
	low[u]=dfn[u]=++tim;//tim表示访问到的时间
	stk[++tp]=u;//用数组模拟栈
	vis[u]=true;//vis[u]表示u是否在栈中
	for(int v:g[u]){//扫描每一条从u出发到v结束的边
		if(!dfn[v]){//v还没有被访问过
			Tarjan(v);//扫描v的子树
			low[u]=min(low[u],low[v]);//更新u的low值
		}
		else if(vis[v]){//v被访问过且在栈中
			low[u]=min(low[u],dfn[v]);//更新u的low值
		}
	}
	if(dfn[u]==low[u]){//能够代表一个强连通分量的点
		int v;
		++scc_cnt;//增加一个强连通分量
		do{
			v=stk[tp--];//出栈
			vis[v]=false;//不再在栈中
			scc[v]=scc_cnt;//v所属的最大强连通分量是scc_cnt
		}while(u!=v);
	}
}

给道例题

3.\(\text{Tarjan}\) 的割点割边算法逻辑

1.定义

首先，我们要明白，这一类问题是多种多样的，而我们要用一个算法全部解决。

这类问题可不是简简单单判个双连通就能够结束的。图中有多少个割点？多少条割边？删去割点最多剩下多少连通块？

2.主算法逻辑

首先我们来说割点。

割点算法的起步当然是判定割点。我们还是以深度优先树为基，讨论：什么情况下一个点才是割点？

考虑割点定义。如果把某个点 \(u\) 删除，图不连通，那么 \(u\) 就是割点。在深度优先树上，这条性质表现为：在 \(u\) 的儿子集合 \(son_u\) 中，如果存在一个点 \(v\in son_u\)，使得 \(v\) 的子树中没有点能够到达 \(u\) 的祖先（不包括 \(u\)），那么自然而然 \(u\) 就是一个割点。

欸，但是有一个特例。如果 \(u\) 本身就是深度优先树的根节点，那一定没有点可以到达 \(u\) 的祖先（不包括 \(u\)），是不是 \(u\) 一定是割点呢？不是的。如果 \(u\) 只有一个子树，那么 \(u\) 不是割点；如果 \(u\) 有两个以上的子树，说明 \(u\) 就一定是割点了。

那要怎么写进代码呢？上一次我说这句话的时候，引出了追溯值 \(low\)，这次也不会例外。

我们定义一个追溯值 \(low\)，那么对于一个结点 \(u\)，它的追溯值 \(low_u\) 就表示其子树中所有结点能够抵达的时间戳最小的结点。

我们想想，是不是当 \(dfn_u\le low_v(v\in son_u)\) 的时候，就说明 \(u\) 是一个割点了？因为没有方式能够从 \(v\) 的子树到达 \(u\) 的祖先（后向边）或者离开 \(u\) 的子树通向外界（横叉边）。这里 \(u\) 的祖先不包括 \(u\)。

为什么 \(dfn_u=low_v\) 时 \(u\) 依然是割点呢？因为 \(u\) 删去后，和 \(u\) 所有相关的边都会删去，就算能够到达 \(u\) 也没关系。

那么割点就这样愉快地判完了，比缩点简单得多。

割边与割点的判定十分相似，甚至一模一样。如果没有方式能够从 \(v\) 的子树到达 \(u\) 的祖先（后向边）或者离开 \(u\) 的子树通向外界（横叉边），说明 \(e=u\rightarrow v\) 就是一条割边了。\(u\) 的子树不包括 \(u\)。

我们观察到这里实际上和割点判定只有一个条件不一样，也就是“\(u\) 的子树不包括 \(u\)”。那么，在割点中，就算 \(dfn_u=low_v\)， \(u\) 依然是割点，原因已经解释。但是，在割边中，\(dfn_u=low_v\) 的时候，\(e\) 就不是一条割边了，因为 \(u\) 并不会随 \(e\) 的删去而删去，\(v\) 子树中的结点仍然可以到达 \(u\)。所以，割边的判定条件是：\(dfn_u<low_v\)。

此外，如果重边在割边的判断中出现了，很明显，这两条重边都不是割边。如果空间和时间允许，可以通过map<pair<int,int>,int>来判断重边。

3.代码

这割点割边可比缩点好写多了，也好理解多了……

在这里只放一个割点的代码：

void Tarjan(int u){
	dfn[u]=low[u]=++tim;//初次访问
	int cnt=0;//砍掉u后图分裂成cnt连通块
	for(int v:g[u]){//扫描u的每一个儿子v
		if(!dfn[v]){
			Tarjan(v);//扫描v子树
			low[u]=min(low[v],low[u]);//更新low值
			if(dfn[u]<=low[v]){
				++cnt;
			}
			
		}
		else{
			low[u]=min(low[u],dfn[v]);//更新u子树中能够到达的结点dfn最小值
		}
	}
	if(u!=anc){
		++cnt;
	}
	if(cnt>=2){
		iscut[u]=true;//其是割点
	}
}

4.\(\text{Tarjan}\) 的最大半连通子图算法逻辑

1.定义

最大半连通子图的定义就如我们上面所言。

那么这里我们要排查一个误区，实际上有向图的半连通图是不等于无向图的连通图的。这是为什么？

我们来举一个例子吧：

在这个例子中，很明显如果每一条边都是无向的，那么这个图是连通的。但是，由于它是有向边，所以 \(A\) 没有到达 \(C\) 的路径，\(C\) 也没有到达 \(A\) 的路径，图是非半连通的。

2.主算法逻辑

根据性质里面所说的，一条链就可以视为一个半连通子图，那么最大半连通子图求的就是最长链。这个东西当然是越听越像树上的东西（不要问我，问就是树的直径），所以第一步我们当然要把它转化为一棵树或者一个森林。

这个时候您再想想，一个森林在图中叫做什么？有向无环图！怎么把一个图转化为一个有向无环图？\(\text{Tarjan}\) 呀！

于是这道题就这么愉快地做完了。\(\text{Tarjan}\) 的主要算法并没有改变，后面加一个求最长链就可以了。

3.代码

代码要放完整的，因为 \(\text{Tarjan}\) 部分基本没变：

#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
typedef pair<int,int> PII;
const int MAXN=1e5+10;
int stk[MAXN],dfn[MAXN],low[MAXN],tp=0,tim=0;
bool vis[MAXN];
vector<int> g[MAXN],ng[MAXN];
int scc_cnt=0,scc[MAXN];
int n,m;
long long mod;
int in_d[MAXN];
int dis[MAXN],p[MAXN];
queue<int> q;
struct EDGE{
	int startpoint;
	int endpoint;
}edge[(MAXN<<3)+(MAXN<<1)];
void Tarjan(int u){
	low[u]=dfn[u]=++tim;
	stk[++tp]=u;
	vis[u]=true;
	for(int v:g[u]){
		if(!dfn[v]){
			Tarjan(v);
			low[u]=min(low[u],low[v]);
		}
		else if(vis[v]){
			low[u]=min(low[u],low[v]);
		}
	}
	if(dfn[u]==low[u]){
		int v;
		++scc_cnt;
		do{
			v=stk[tp--];
			vis[v]=false;
			scc[v]=scc_cnt;
			++p[scc_cnt];
		}while(u!=v);
	}
}
unordered_set<long long> S;
long long f[MAXN],b[MAXN];
int main(){
	scanf("%d%d%lld",&n,&m,&mod);
	for(int i=0,u,v;i<m;++i){
		scanf("%d%d",&u,&v);
		g[u].push_back(v);
	}
	for(int i=1;i<=n;++i){
		if(!dfn[i]){
			Tarjan(i);
		}
	}
	for(int i=1;i<=n;++i){
		for(int j:g[i]){
			int u=scc[i],v=scc[j];
			long long hash=1000000ll*u+v;
			if((u!=v)&&(!S.count(hash))){
				S.emplace(hash);
				ng[u].push_back(v);
			}
		}
	}
	for(int u=scc_cnt;u>0;--u){
		if(f[u]==0){
			f[u]=p[u];
			b[u]=1;
		}
		for(int v:ng[u]){
			if(f[v]<f[u]+p[v]){
				f[v]=f[u]+p[v];
				b[v]=b[u];
			}
			else if(f[v]==f[u]+p[v]){
				b[v]=(b[u]+b[v])%mod;
			}
		}
	}
	long long maxl=0,maxcnt=0;
	for(int i=1;i<=scc_cnt;++i){
		if(f[i]>maxl){
			maxl=f[i];
			maxcnt=b[i];
		}
		else if(f[i]==maxl){
			maxcnt=(maxcnt+b[i])%mod;
		}
	}
	printf("%lld\n%lld",maxl,maxcnt);
}

posted @ 2024-09-22 16:31 KarmaticEnding 阅读(570) 评论(1) 收藏举报

刷新页面返回顶部

KarmaticEnding

Tarjan算法及其应用 总结+详细讲解+详细代码注释

\(\text{Tarjan}\)

1.引入概念

1.强连通分量

1.定义

2.性质

2.时间戳

1.定义

2.作用

3.边的分类

1.深度优先树的定义

2.边的分类

4.割点、点双连通、割边、边双连通

1.定义

2.性质

5.链和最大半连通子图

1.定义

2.性质

2.\(\text{Tarjan}\) 的缩点算法逻辑

1.定义

2.不同类型的边在强连通分量中的作用

3.主算法逻辑

4.代码逻辑

3.\(\text{Tarjan}\) 的割点割边算法逻辑

1.定义

2.主算法逻辑

3.代码

4.\(\text{Tarjan}\) 的最大半连通子图算法逻辑

1.定义

2.主算法逻辑

3.代码

公告

Tarjan算法及其应用总结+详细讲解+详细代码注释