数据结构（九）：并查集

一、 并查集概述

　　并查集是一种树形结构，用来判断两个元素是否在同一棵树上，以及合并两个元素所在的树。

二、 并查集特性

　　并查集是一种树形结构，但它的特性不像2-3树，二叉树，红黑树那么复杂：

　　1、每个结点都只有一个元素，每一组元素都在一棵树上

　　2、一个组中的元素和另一组的元素间没有任何联系

　　3、元素在树中没有严格的父子大小要求

三、 并查集实现

　　在初始化并查集时，我们通常把元素作为数组的索引，数组的值为元素所在的组别（如果元素非int类型，则可使用其他映射结构来使元素和int类型的数据对应）

　　当我们合并元素A和B时，只需修改索引A和B的值为相同值即可，如下让元素4和5合并成一个组

/**

* 并查集实现

* @author jiyukai

public class UF {

//记录结点元素和该结点所在组的标识

public int[] valueAndgroup;

//并查集的组个数

public int N;

/**

* 并查集构建

* @param N

public UF(int n) {

//分组个数赋值

this.N = n;

//数组初始化

valueAndgroup = new int[n];

//数组的索引为结点元素的值，值为所在组的标志，初始化时假设每个组有一个元素，则索引用元素表示，所在组可以初始化为i

//使用整数来表示节点的值，如果需要其他数据类型，可以用hashTable来进行映射。如：将string映射为int类型

for(int i=0;i<n;i++) {

valueAndgroup[i] = i;

}

/**

* 并查集分组个数

* @return

public int count() {

return N;

}

/**

* 查找元素p所在分组的标志

* @param p

* @return

public int find(int p) {

return valueAndgroup[p];

}

/**

* 判断元素p和q是否在同个分组中

* @param p

* @param q

* @return

public boolean isConnected(int p,int q) {

return valueAndgroup[p]==valueAndgroup[q];

}

/**

* 合并元素p和q

* @param p

* @param q

public void union(int p,int q) {

//p和q已在同一组别中，不用合并

if(isConnected(p, q)) {

return;

}

//找出p和q所在的组

int p_group = find(p);

int q_group = find(q);

//将valueAndgroup中p所在组的值更新为q的所在组

for(int i=0;i<valueAndgroup.length;i++) {

if(valueAndgroup[i]==p_group) {

valueAndgroup[i] = q_group;

}

//组别-1

N--;

}

四、 并查集合并优化

　　在计算机网络中，假设并查集的每个元素为每台计算机的ip，那么通过调用isConnected方法则可知道两台计算机是否互联，调用union方法则可以让两台计算互联。

　　在实际运用中，若要使所有计算机两两互联，需要调用N^2次，时间复杂度是相当高的，因此我们需要对算法进行优化。

　　假设有两棵独立的树，为了无需在union合并时，遍历整个数组去修改两棵树中元素的组，我们希望将两根树的进行合并，归属于同一个根结点，这样则需要并查集数组中存放的值为元素的父结点

　　这样我们在合并时只需将两棵树的根结点修改为同一个，则省去了union的遍历带来的耗时，算法优化如下。

　　在如下示意图中，当我们顺着元素（即索引）找父节点，当找到元素和父节点相同时，则认为该元素为根结点，如下图我们可找到4为0的根结点。

　　在union合并中，我们只需将两棵树的根结点修改为同一个元素，即可将两棵独立的树进行合并

　　合并后成为如下，只需一步操作完成

/**

* 并查集实现

* @author jiyukai

public class UF_Tree {

//记录结点元素和该结点的父结点

public int[] valueAndgroup;

//并查集的组个数

public int N;

/**

* 并查集构建

* @param N

public UF_Tree(int n) {

//分组个数赋值

this.N = n;

//数组初始化

valueAndgroup = new int[n];

//数组的索引为结点元素的值，值为所在组的标志，初始化时假设每个组有一个元素，则索引用元素表示，所在组可以初始化为i

//使用整数来表示节点的值，如果需要其他数据类型，可以用hashTable来进行映射。如：将string映射为int类型

for(int i=0;i<n;i++) {

valueAndgroup[i] = i;

}

/**

* 并查集分组个数

* @return

public int count() {

return N;

}

/**

* 查找元素p所在分组的标志

* @param p

* @return

public int find(int p) {

while(true) {

if(p == valueAndgroup[p]) {

return p;

}

p = valueAndgroup[p];

}

/**

* 合并元素p和q

* @param p

* @param q

public void union(int p,int q) {

//找出p和q所在的根结点

int p_root = find(p);

int q_root = find(q);

//如果q和p的根结点相同

if(p_root==q_root) {

return;

}

//如果p和q不在一个分组，则让p的父节点为q的父节点，这样两颗独立的树就合并到一起，就无需再遍历整个数组去查找

valueAndgroup[p_root] = q_root;

//组别-1

N--;

}

五、 并查集搜索优化

　　上述的优化中，我们修改了union方法，使union原本O（N）的复杂度变成了O（1），但是find方法的复杂度却增加了，变成了O（N），所以如上算法的最坏情况下还是O（N^2）

　　这时我们需要对find进行再次优化

　　在合并两棵树时，我们发现，当小树合并大树，即小树的根结点作为大树的根结点时，树的层级会加深，如下图。

　　而当大树合并小树，即大树的根结点作为小树的根结点时，树的层级不会加深，此时可以在find方法处提高效率。

　　原始树：

　　小树合并大树后层级加深

　　大树合并小树后层级不变

　　因此，为完成这个需求，我们需要另外一个数组来记录每个元素所在树的层级大小，方便合并时做出判断，实现大树合并小树。

/**

* 小树合并大树并查集

* @author jiyukai

public class UF_Shorter_Tree {

//记录结点元素和该结点的父结点

public int[] valueAndgroup;

//记录结点元素所在树的深度

private int[] nodeCount;

//并查集的组个数

public int N;

/**

* 并查集构建

* @param N

public UF_Shorter_Tree(int n) {

//分组个数赋值

this.N = n;

//数组初始化

valueAndgroup = new int[n];

//数组的索引为结点元素的值，值为所在组的标志，初始化时假设每个组有一个元素，则索引用元素表示，所在组可以初始化为i

//使用整数来表示节点的值，如果需要其他数据类型，可以用hashTable来进行映射。如：将string映射为int类型

for(int i=0;i<n;i++) {

valueAndgroup[i] = i;

}

//初始化结点元素所在的深度,每个元素初始化的深度为1

nodeCount = new int[n];

for(int j=0; j<n; j++) {

nodeCount[j] = 1;

}

/**

* 并查集分组个数

* @return

public int count() {

return N;

}

/**

* 查找元素p所在分组的标志

* @param p

* @return

public int find(int p) {

while(true) {

if(p == valueAndgroup[p]) {

return p;

}

p = valueAndgroup[p];

}

/**

* 合并元素p和q

* @param p

* @param q

public void union(int p,int q) {

//找出p和q所在的根结点

int p_root = find(p);

int q_root = find(q);

//如果q和p的根结点相同

if(p_root==q_root) {

return;

}

if(p_root < q_root) {

//p所在树的深度小于q所在树的深度，p相对于q是小树

//大树的根作为小树的根去合并

valueAndgroup[p_root] = q_root;

//更改结点所在树的深度

nodeCount[q_root] = nodeCount[q_root] + nodeCount[p_root];

}else {

//q所在树的深度小于p所在树的深度，q相对于p是小树

//大树的根作为小树的根去合并

valueAndgroup[q_root] = p_root;

//更改结点所在树的深度

nodeCount[p_root] = nodeCount[p_root] + nodeCount[q_root];

}

//组别-1

N--;

}

posted @ 2020-12-02 00:01 纪煜楷阅读(499) 评论(0) 收藏举报

刷新页面返回顶部

纪煜楷

数据结构（九）：并查集

公告