时间过得真快,一眨眼集训第二周就要结束了。有很长的第一段时间没有写算法类的博客了。今天先来一篇 --- 并查集。
1、什么是并查集
并查集(Union Find)是一种用于管理分组的数据结构。它具备两个操作:(1)查询元素a和元素b是否为同一组 (2) 将元素a和b合并为同一组。
注意:并查集不能将在同一组的元素拆分为两组。
2、并查集的结构
并查集可以使用树来实现。
使用树形结构来表示以后,每一组都对应一棵树,然而我们就可以将这个问题转化为树的问题了,我们看两个元素是否为一组我们只要看这两个元素的根是否一致。显然,使用树形结构将问题简单化了。合并时是我们只需要将一组的根与另一组的根相连即可。
3、并查集的实现
我们通过以上的思路,现在就可以具体来实现并查集了,代码如下:
int node[i]; //每个节点 //初始化n个节点 void Init(int n){ for(int i = 0; i < n; i++){ node[i] = i; } } //查找当前元素所在树的根节点(代表元素) int find(int x){ if(x == node[x]) return x; return find(node[x]); } //合并元素x, y所处的集合 void Unite(int x, int y){ //查找到x,y的根节点 x = find(x); y = find(y); if(x == y) return ; //将x的根节点与y的根节点相连 node[x] = y; } //判断x,y是属于同一个集合 bool same(int x, int y){ return find(x) == find(y); }
有了这些知识,我们就可以来解决一些问题了。先上两道并查集的水题:畅通工程,How many Tables?
4、并查集的优化
细心的同学会发现,我们使用以上的代码来实现并查集,会出现一个问题 --- 树的退化。在树形数据结构中,如果发生退化,那么复杂度将会变得很高(最惨的是直接退化成线性结构)。因此我们必须设法,阻止这种退化。为此我们这里有两种方法。
<1>对于每一棵树,我们记录它的高度(rank)。在每次合并操作时,将高度小的树 放在 高度高的树下,成为它的子树:
通过这样处理之后,可以有效的防止树的退化,但是查询效率还不够快,于是我们有提出了第二种优化方案。
<2>路径压缩
我们将原先间接与根相连的节点,让它与根直连,这样效率又可以大大的提高了:
我们在第一次查询时,进行这步操作,当再次查询时,就大大提高了效率。
5、并查集的复杂度
加入这两个优化之后,并查集的效率就非常高。对n个元素的并查集操作一次的复杂度是: O(α(n))。这里,α(n)是阿克曼(Ackermann)函数的反函数。效率要高于O(log n)。
不过这里O(α(n))是平均复杂度。也就是说,多次操作之后平均复杂度为O(α(n)),换而言之,并不是每一次操作都满足O(α(n))。
6、优化后的并查集实现
int node[i]; //每个节点 int rank[i]; //树的高度 //初始化n个节点 void Init(int n){ for(int i = 0; i < n; i++){ node[i] = i; rank[i] = 0; } } //查找当前元素所在树的根节点(代表元素) int find(int x){ if(x == node[x]) return x; return node[x] = find(node[x]); //在第一次查找时,将节点直连到根节点 } //合并元素x, y所处的集合 void Unite(int x, int y){ //查找到x,y的根节点 x = find(x); y = find(y); if(x == y) return ; //判断两棵树的高度,然后在决定谁为子树 if(rank[x] < rank[y]){ node[x] = y; }else{ node[y] = x; if(rank[x] == rank[y]) rank[x]++: } } //判断x,y是属于同一个集合 bool same(int x, int y){ return find(x) == find(y); }
现在我们已经大致的来解了并查集,我们来一道,有一点难度的题目练练手:食物链
版权声明:本文为博主原创文章,未经博主允许不得转载。
原文地址:http://blog.csdn.net/luomingjun12315/article/details/47373345