期待已久的并查集如期到来。
并查集(DSU)
并查集的英文是Disjoint Set Union, 因此又称(DSU)。
并查集,在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中。简单的来说就是分门别类的问题。
并查集有两种优化策略:
1.按秩合并 Union by Rank
2.路径压缩 Path Compression
引例
江湖中有许多厉害的大侠,他们相互争斗,争个江湖第一,但是这些大侠又有许多的朋友徒弟等熟人,他们见了面不能打架,好了问题来,江湖中有很多大侠,我们该如何区分敌人和朋友呢?
其实这是一个并查集的问题,将朋友徒弟等熟人归为一个门派(这里其实是集合),如果他们属于一个门派,那么他们就不能打架,否则是敌人,要打架的。
并查集有两个关键的函数,分别的Find()和Join()函数
代码语言:javascript复制//find函数
int find(int x)
{
int r = x;
while(pre[r]!=r)
r = pre[r];
return r;
}
//join函数
void join(int x,int y)
{
int fx = find(x),fy = find(y);
if(x!=fy)
pre[fx] = fy;
}
以上就是并查集的核心代码。
HDU1232
好了来一到并查集的经典题练练手。
某省调查城镇交通状况,得到现有城镇道路统计表,表中列出了每条道路直接连通的城镇。省政府“畅通工程”的目标是使全省任何两个城镇间都可以实现交通(但不一定有直接的道路相连,只要互相间接通过道路可达即可)。问最少还需要建设多少条道路?
Input
测试输入包含若干测试用例。每个测试用例的第1行给出两个正整数,分别是城镇数目N ( < 1000 )和道路数目M;随后的M行对应M条道路,每行给出一对正整数,分别是该条道路直接连通的两个城镇的编号。为简单起见,城镇从1到N编号。 注意:两个城市之间可以有多条道路相通,也就是说 3 3 1 2 1 2 2 1 这种输入也是合法的 当N为0时,输入结束,该用例不被处理。
Output
对每个测试用例,在1行里输出最少还需要建设的道路数目。
Sample Input
代码语言:javascript复制4 2
1 3
4 3
3 3
1 2
1 3
2 3
5 2
1 2
3 5
999 0
0
Sample Output
代码语言:javascript复制1
0
2
998
路径压缩
这里有一个问题,想没想过数据量非常大,如果按照上述代码,所有的集合会变成一字长蛇,这就是按秩合并,但这样查找的效率就会比较低下。最理想的情况就是所有人的直接上级都是掌门,一共就两级结构,只要找一次就找到掌门了。哪怕不能完全做到,也最好尽量接近。这样就产生了路径压缩算法。
好了上代码
代码语言:javascript复制/*路径压缩是对find()函数的优化*/
int find(int x)
{
if(pre[x] == x)
return x;
else
return pre[x] = find(pre[x]);
}
void join(int x,int y)
{
int fx = find(x),fy = find(y);
if(x!=fy)
pre[fx] = fy;
}