对于并查集的原理和应用,主要有三点重点需要理解记忆。
集合的表示
集合里的每一个个体都需要保存两种数据,一个是自身的数据,一个是它的父亲是谁,由于本题所给数据都为数字,故可以直接用一个数组来存储(类似与静态链表的感觉),数组的下标就代表了是第几个个体,而每个值则代表父亲是谁,初始值全设为-1,最后将根结点的值修改成 (-儿子个数),这样在按秩归并的时候用来判断集合的大小(即树高)
按秩归并
普通的归并:
setname find(set s, int x)
{
for(;s[x]>=0;x=s[x]);
return x;
}
void union(set s, root a,root b)
{
s[a]=b;
}
这样的归并会造成有可能树的高度会极端偏高,如一颗高树和一颗矮树,若将高树归到矮树上,树高就会增加,而如果将矮树归到高数上,树高就不会增加,所以我们每次都应该将矮树归并到高树上,这样find操作的时候就会很快
按秩归并:
void union(set s, root a,root b)
{
if(s[a]>s[b])//a是矮树
{
s[a]=b;
s[b]+=s[a];
}
else {
s[b]=a;
s[a]+=s[b];
}
}
路径压缩
路径压缩就是让这一个元素的这一条线上的所有元素都可以直接指向最高的父节点,这样就可以大大减少树的高度以及find函数查询的时间。
setname find(set s, int x)
{
if(s[x]<0)return x;
else return s[x]=find(s,s[x]);
}