转：强连通分量(SCC)详解

说到以Tarjan命名的算法，我们经常提到的有3个，其中就包括本文所介绍的求强连通分量的Tarjan算法。而提出此算法的普林斯顿大学的Robert E Tarjan教授也是1986年的图灵奖获得者（具体原因请看本博“历届图灵奖得主”一文）。

首先明确几个概念。
强连通图。在一个强连通图中，任意两个点都通过一定路径互相连通。比如图一是一个强连通图，而图二不是。因为没有一条路使得点4到达点1、2或3。

强连通分量。在一个非强连通图中极大的强连通子图就是该图的强连通分量。比如图三中子图{1,2,3,5}是一个强连通分量，子图{4}是一个强连通分量。

其实，tarjan算法的基础是DFS。我们准备两个数组Low和Dfn。Low数组是一个标记数组，记录该点所在的强连通子图所在搜索子树的根节点的Dfn值（很绕嘴，往下看你就会明白），Dfn数组记录搜索到该点的时间，也就是第几个搜索这个点的。根据以下几条规则，经过搜索遍历该图（无需回溯）和对栈的操作，我们就可以得到该有向图的强连通分量。

数组的初始化：当首次搜索到点p时，Dfn与Low数组的值都为到该点的时间。
堆栈：每搜索到一个点，将它压入栈顶。
当点p有与点p’相连时，如果此时（时间为dfn[p]时）p’不在栈中，p的low值为两点的low值中较小的一个。
当点p有与点p’相连时，如果此时（时间为dfn[p]时）p’在栈中，p的low值为p的low值和p’的dfn值中较小的一个。
每当搜索到一个点经过以上操作后（也就是子树已经全部遍历）的low值等于dfn值，则将它以及在它之上的元素弹出栈。这些出栈的元素组成一个强连通分量。
继续搜索（或许会更换搜索的起点，因为整个有向图可能分为两个不连通的部分），直到所有点被遍历。
由于每个顶点只访问过一次，每条边也只访问过一次，我们就可以在O（n+m）的时间内求出有向图的强连通分量。但是，这么做的原因是什么呢？

Tarjan算法的操作原理如下：
Tarjan算法基于定理：在任何深度优先搜索中，同一强连通分量内的所有顶点均在同一棵深度优先搜索树中。也就是说，强连通分量一定是有向图的某个深搜树子树。
可以证明，当一个点既是强连通子图Ⅰ中的点，又是强连通子图Ⅱ中的点，则它是强连通子图Ⅰ∪Ⅱ中的点。
这样，我们用low值记录该点所在强连通子图对应的搜索子树的根节点的Dfn值。注意，该子树中的元素在栈中一定是相邻的，且根节点在栈中一定位于所有子树元素的最下方。
强连通分量是由若干个环组成的。所以，当有环形成时（也就是搜索的下一个点已在栈中），我们将这一条路径的low值统一，即这条路径上的点属于同一个强连通分量。
如果遍历完整个搜索树后某个点的dfn值等于low值，则它是该搜索子树的根。这时，它以上（包括它自己）一直到栈顶的所有元素组成一个强连通分量。

#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;

const int MAXNODE = 510;
const int MAXEDGE = 100010;

struct Edge{
    int u, v, next;
    Edge() {}
    Edge(int u, int v, int next):u(u), v(v), next(next) {}
}E[MAXEDGE];

//head数组表示头指针,
//pre数组纪录的是时间戳,
//sccno纪录的是节点是属于哪个强连通分量的
//lowlink纪录当前节点及其后代所能连回的最早的祖先的时间戳,
//Stack数组模拟栈,num数组纪录的是每个强连通分量中有多少个节点

int head[MAXNODE], pre[MAXNODE], lowlink[MAXNODE], sccno[MAXNODE], Stack[MAXNODE], num[MAXNODE];

//tot纪录的是边的数量,
//dfs_clock就是时间戳,top指向栈顶,
//scc_cnt纪录有多少个强连通分量
int tot, n, m, dfs_clock, top, scc_cnt;

void AddEdge(int u, int v) {
    E[tot] = Edge(u, v, head[u]);
    head[u] = tot++;
}

void init() {
    memset(head, -1, sizeof(head));
    tot = 0;

    int u, v;
    for (int i = 0; i < m; i++) {
        scanf("%d%d", &u, &v);
        AddEdge(u, v);
    }
}

void dfs(int u) {
    pre[u] = lowlink[u] = ++dfs_clock;//纪录当前节点的时间戳
    Stack[++top] = u;

    for (int i = head[u]; ~i; i = E[i].next) {
        int v = E[i].v;
        //如果下一个节点没有访问过
        if (!pre[v]) {
            dfs(v);
            lowlink[u] = min(lowlink[u], lowlink[v]);
        }//如果下一个节点已经被访问过了,且不属于任何一个连通分量
        else if (!sccno[v]) lowlink[u] = min(lowlink[u], pre[v]);
    }

    int x;
    //满足强连通分量的要求，当前节点u为该强连通分量最早发现的节点
    if (pre[u] == lowlink[u]) {
        scc_cnt++; num[scc_cnt] = 0;
        while (1) {
            x = Stack[top--];
            num[scc_cnt]++;
            sccno[x] = scc_cnt;
            if (x == u) break;
        }
    }
}

void solve() {
    memset(pre, 0, sizeof(pre));
    memset(sccno, 0, sizeof(sccno));
    dfs_clock = top = scc_cnt = 0;

    for (int i = 0; i < n; i++)  //注意点的标号 0~n-1 or 1~n;
        if (!pre[i]) dfs(i);
}

int main() {
    init();
    solve();
    return 0;
}

posted on 2016-01-09 17:12 cleverbiger 阅读(4537) 评论(0) 收藏举报

刷新页面返回顶部