图论篇2——最小生成树算法（kurskal算法&prim算法）

基本概念

树（Tree）

如果一个无向连通图中不存在回路，则这种图称为树。

生成树（Spanning Tree）

无向连通图G的一个子图如果是一颗包含G的所有顶点的树，则该子图称为G的生成树。

生成树是连通图的极小连通子图。这里所谓极小是指：若在树中任意增加一条边，则将出现一条回路；若去掉一条边，将会使之变成非连通图。

最小生成树

一个带权值的连通图。用$n-1$条边把$n$个顶点连接起来，且连接起来的权值最小。

应用场景

设想有9个村庄，这些村庄构成如下图所示的地理位置，每个村庄的直线距离都不一样。若要在每个村庄间架设网络线缆，若要保证成本最小，则需要选择一条能够联通9个村庄，且长度最小的路线。

Kruskal算法

知识点：数据结构——并查集

基本思想

始终选择当前可用、不会（和已经选取的边）构成回路的最小权植边。

具体步骤：

1. 将所有边按权值进行升序排序

2. 依次选择权值最小的边

3. 若该边的两个顶点落在不同的连通分量上，选择这条边，并把这两个顶点标记为同一连通分量；若这条边的两个顶点落到同一连通分量上，舍弃这条边。反复执行2,3，直到所有的都在同一连通分量上。【这一步需要用到上面的并查集】

模板题：https://www.luogu.org/problem/P3366

#include <iostream>
#include <algorithm>
using namespace std;
int pre[5005];
int n, m; //n个定点，m条边

struct ENode {
    int from, to, dis;
    bool operator<(ENode p) {
        return dis < p.dis;
    }
}M[200005];

int Find(int x) {
    return x == pre[x] ? pre[x] : pre[x] = Find(pre[x]);
}

int kurskal() {
    sort(M, M + m);
    int N = n, res = 0;
    for (int i = 0; i < m && N > 1; i++) {
        int fx = Find(M[i].from), fy = Find(M[i].to);
        if (fx != fy) {
            pre[fx] = fy;
            N--;//找到了一条边，当N减到1的时候表明已经找到N-1条边了，就完成了
            res += M[i].dis;
        }
    }
    if (N == 1)//循环做完，N不等于1 表明没有找到合适的N-1条边来构成最小生成树
        return res;
    return -1;
}

int main() {
    cin >> n >> m;
    for (int i = 0; i <= n; i++) {
        pre[i] = i;
    }
    for (int i = 0; i < m; i++) {
        scanf("%d%d%d", &M[i].from, &M[i].to, &M[i].dis);;
    }
    int ans = kurskal();
    if (ans != -1)
        cout << ans << endl;
    else
        cout << "orz" << endl;
    return 0;
}

Prim算法

Prim算法思想：

首先将图的点分为两部分，一种是访问过的$u$（第一条边任选），一种是没有访问过的$v$

1: 每次找$u$到$v$的权值最小的边。

2: 然后将这条边中的$v$中的顶点添加到$u$中，直到$v$中边的个数$=$顶点数$-1$

图解步骤：

维护一个$dis$数组，记录只使用已访问节点能够到达各未访问节点最短的权值。

初始值为节点1（任意一个都可以）到各点的值，规定到自己是0，到不了的是$inf$（定义一个特别大的数）。

找当前能到达的权值最短的点。1-->4，节点4

将dis[4]赋值为0，标记为已访问过，同时借助4节点更新dis数组。

后面依次

最后整个dis数组都是0了，最小生成树也就出来了，如果$dis$数组中还有 $inf$ 的话，说明这不是一个连通图。

还是上面那道模板题：https://www.luogu.org/problem/P3366

#include <iostream>

#include <fstream>
using namespace std;

struct ENode {
    int dis, to;//权重、指向
    ENode* next = NULL;
    void push(int to, int dis) {
        ENode* p = new ENode;
        p->to = to; p->dis = dis;
        p->next = next;
        next = p;
    }
}*head;
const int inf = 1 << 30;
int N, M;
int dis[5005];

int prim() {
    int res = 0;

    for (int i = 2; i <= N; i++) {
        dis[i] = inf;
    }

    for (int i = 0; i < N; i++) {//与kurskal区分，找边是N-1条边，找点是N个点
        int v = 1 , MIN = inf;
        for (int j = 1; j <= N; j++) {
            //到不了的，访问过的不进行比较
            if (dis[j] != 0 && dis[j] < MIN) {
                v = j;
                MIN = dis[j];
            }
        }
        if (MIN == inf && v != 1)//这里v!=1是为了把dis的初始化放在循环里面做，也可以放在循环外面做，但是外层循环就只需要做N-1次了
            return -1;//还没找够n个点，没路了
        res += dis[v];
        dis[v] = 0;
        ENode *p = head[v].next;
        while (p) {
            if (dis[p->to] > p->dis) {
                dis[p->to] = p->dis;
            }
            p = p->next;
        }
    }
    return res;
}

int main() {
#ifdef LOCAL
    fstream cin("data.in");
#endif // LOCAL

    cin >> N >> M;
    head = new ENode[N + 1];
    for (int i = 0; i < M; i++) {
        int from, to, dis;
        scanf("%d%d%d", &from, &to, &dis);
        //cin >> from >> to >> dis;
        head[from].push(to, dis);
        head[to].push(from, dis);
    }
    int ans = prim();
    if (ans != -1)
        cout << ans << endl;
    else
        cout << "orz" << endl;
    return 0;
}

两者区别

时间复杂度

prim算法

时间复杂度为$O(n^2)$，$n$为顶点的数量，其时间复杂度与边得数目无关，适合稠密图。

kruskal算法

时间复杂度为$O(e\cdot loge)$，$e$为边的数目，与顶点数量无关，适合稀疏图。

其实就是排序的时间，因为并查集的查询、合并操作都是$O(1)$。

总结

通俗点说就是，点多边少用Kruskal，因为Kruskal算法每次查找最短的边。点少边多用Prim，因为它是每次找一个顶点。

具体选择用那个，可以用电脑算一下，题目给的数据级别，$n^2$和$e\cdot loge$看看那个小，比如上面的模板题，题目给的数据级别是$(n<=5000,e<=200000)$，粗略估算一下，kurskal算法一定是会快不少的，结果也确实如粗。

实现难度

明眼人都能看出来，kurskal算法要简单太多了。kurskal算法不需要把图表示出来，而Prim算法必须建表或者邻接矩阵，所以从上面的数据也能看出来当边的数目较大时，Prim算法所占用的空间比kurskal算法多了很多。

拓展

堆优化Prim算法

用堆存储当前所有可到达的点和距离，就是把dis数组里的内容一式两份，存在堆里，然后每次取堆顶元素，每次操作为$O(logn)$，所以使用堆优化后的Prim算法理论上时间复杂度为$O(nlogn)$，但是好像没有达到想要的效果

看了测试数据发现，有很多重边，那就合理了，做了很多次的无用循环，所以时间上也和kurskal比较相近。所以在数据可靠、无重边的情况下，这个算法一定是上述几种中最快的一个。

#include <iostream>
#include <fstream>
#include <cstdio>
#include <queue>

using namespace std;
struct P {
    int dis, v;
    P(int d, int v) :dis(d), v(v) {};
    bool operator<(P p)const {
        return p.dis < dis;
    }
};
struct ENode {
    int dis, to;//权重、指向
    ENode* next = NULL;
    void push(int to, int dis) {
        ENode* p = new ENode;
        p->to = to; p->dis = dis;
        p->next = next;
        next = p;
    }
}*head;
const int inf = 1 << 30;
int N, M;
int dis[5005];
bool fuck[5005];

int prim() {
    priority_queue<P>pq;
    pq.push(P(0, 1));
    int res = 0, cnt = N;
    dis[1] = 0;
    fill(dis + 1, dis + N + 1, inf);

    while (!pq.empty() && cnt > 0) {//与kurskal区分，找边是N-1条边，找点是N个点
        int v = pq.top().v, d = pq.top().dis;
        pq.pop();
        if (fuck[v])continue;
        fuck[v] = true;
        res += d;
        cnt--;
        ENode* p = head[v].next;
        while (p) {
            if (dis[p->to] > p->dis) {
                dis[p->to] = p->dis;
                pq.push(P(p->dis, p->to));
            }
            p = p->next;
        }
    }
    if (cnt > 1)
        return -1;
    return res;
}

int main() {
#ifdef LOCAL
    fstream cin("data.in");
#endif // LOCAL
    cin >> N >> M;
    head = new ENode[N + 1];
    for (int i = 0; i < M; i++) {
        int from, to, dis;
        scanf("%d%d%d", &from, &to, &dis);
        //cin >> from >> to >> dis;
        head[from].push(to, dis);
        head[to].push(from, dis);
    }
    int ans = prim();
    if (ans != -1)
        cout << ans << endl;
    else
        cout << "orz" << endl;
    return 0;
}

posted @ 2019-10-24 23:40 czc1999 阅读(425) 评论(0) 收藏举报

刷新页面返回顶部

czc1999