Interested Article - Система непересекающихся множеств

Система непересекающихся множеств ( англ. disjoint-set , или union–find data structure ) — структура данных , которая позволяет администрировать множество элементов, разбитое на непересекающиеся подмножества. При этом каждому подмножеству назначается его представитель — элемент этого подмножества. Абстрактная структура данных определяется множеством трёх операций: $\{\mathrm {Union} ,\mathrm {Find} ,\mathrm {MakeSet} \}$ .

Применяется для хранения компонент связности в графах , в частности, алгоритму Краскала необходима подобная структура данных для эффективной реализации.

Определение

Пусть $S$ конечное множество, разбитое на непересекающиеся подмножества ( классы ) $X_{i}$ :

S=X_{0}\cup X_{1}\cup X_{2}\cup \ldots \cup X_{k}:X_{i}\cap X_{j}=\varnothing \quad \forall i,j\in \lbrace 0,1,\ldots ,k\rbrace ,i\neq j

.

Каждому подмножеству $X_{i}$ назначается представитель $r_{i}\in X_{i}$ . Соответствующая система непересекающихся множеств поддерживает следующие операции:

$\mathrm {MakeSet} (x)$ : создаёт для элемента $x$ новое подмножество. Назначает этот же элемент представителем созданного подмножества.
$\mathrm {Union} (r,s)$ : объединяет оба подмножества, принадлежащие представителям $r$ и $s$ , и назначает $r$ представителем нового подмножества.
$\mathrm {Find} (x)$ : определяет для $x\in S$ подмножество, к которому принадлежит элемент, и возвращает его представителя.

Алгоритмическая реализация

Тривиальная реализация сохраняет принадлежность элементов из $S$ и представителей $r_{i}$ в индексном массиве . На практике же чаще используются множества деревьев . Это позволяет существенно сократить время, необходимое для операции Find . При этом представитель записывается в корень дерева, а остальные элементы класса в узлы под ним.

$\mathrm {Union} (r,s)$ : вешает корень более низкого дерева под корень более высокого дерева. Если при этом $r$ становится потомком $s$ , оба узла меняются местами.
$\mathrm {Find} (x)$ : проходит путь от $x$ до корня дерева и возвращает его (корень в данном случае является представителем).

Эвристики

Для ускорения операций Union и Find могут быть использованы эвристики Union-By-Size , Union-By-Height , Random-Union и сжатие путей.

В эвристике Union-By-Size во время операции $\mathrm {Union} (r,s)$ корень меньшего дерева вешается под корень большего дерева. Благодаря этому подходу сохраняется балансировка дерева. Глубина каждого поддерева $T$ не может превысить величину $\log \left|T\right|$ . При использовании этой эвристики время операции Find в худшем случае увеличивается с $O(\log n)$ до $O(n)$ . Для эффективной реализации предлагается сохранять в корне количество узлов в дереве.

Эвристика Union-By-Height аналогична Union-By-Size , но использует высоту дерева вместо размера.

В эвристике Random-Union используется тот факт, что можно не тратить дополнительные $O(n)$ памяти на сохранение количества узлов в дереве: достаточно выбирать корень случайным образом — такое решение даёт на случайных запросах скорость, вполне сравнимую с другими реализациями. Тем не менее, если имеется много запросов вида «объединить большое множество с маленьким», данная эвристика улучшает матожидание (то есть среднее время работы) всего в два раза, поэтому использовать её без эвристики сжатия путей не рекомендуется.

Эвристика сжатия путей используется, чтобы ускорить операцию $\mathrm {Find} (x)$ . При каждом новом поиске все элементы, находящиеся на пути от корня до искомого элемента, вешаются под корень дерева. В этом случае операция Find будет работать в среднем $\alpha (n)$ , где $\alpha$ — функция, обратная функции Аккермана . Это позволяет значительно ускорить работу, так как $\alpha$ для всех применяемых на практике значений принимает значение, меньшее 5.

Пример реализации

Реализация на C++:

const int MAXN = 1000;

int p[MAXN], rank[MAXN];

void MakeSet(int x) 
{
    p[x] = x;
    rank[x] = 0;
}

int Find(int x) 
{
    return ( x == p[x] ? x : p[x] = Find(p[x]) );
}

void Union(int x, int y) 
{
    if ( (x = Find(x)) == (y = Find(y)) )
        return;
	
    if ( rank[x] <  rank[y] )
        p[x] = y;
    else {
        p[y] = x;
        if ( rank[x] == rank[y] )
            ++rank[x];
    }
}

Реализация на Free Pascal:

const MAX_N = 1000;

var Parent , Rank : array [ 1 .. MAX_N ] of LongInt;

procedure swap ( var x , y : LongInt );
  var tmp : LongInt;
begin
  tmp := x; 
  x := y; 
  y := tmp;
end;

procedure MakeSet ( x : LongInt ) ;
begin
  Parent[x] := x;
  Rank[x] := 0;
end;

function Find ( x : LongInt ) : LongInt;
begin
  if ( Parent[x] <> x ) then
    Parent[x] := Find ( Parent[x] );
  Exit ( Parent[x] );
end;

procedure Union ( x , y : LongInt );
begin
  x := Find ( x );
  y := Find ( y );
  if ( x = y ) then exit();
  if ( Rank[x] < Rank[y] ) then swap ( x , y );
  
  Parent[y] := x;
  if ( Rank[x] = Rank[y] ) then
    inc ( Rank[x] );
end;

См. также

Лес непересекающихся множеств

Литература

// Communications of the ACM , 7.5 (1964): 301—303. (англ.)
// Journal of the ACM 31.2 (1984): 245—281. (англ.)
Томас Кормен и др. Алгоритмы: построение и анализ = Introduction to Algorithms. — 2-е изд. — М. : , 2006. — С. 1296. — ISBN 0-07-013151-1 .

Ссылки

/ Kevin Wayne, Pearson-Addison Wesley (англ.)
/ Introduction to Algorithms, Thomas H. Cormen, Charles E. Leiserson, and Ronald L. Rivest (англ.)
/ ИТМО
, 2006

Структуры данных
Типы	Коллекция Контейнер
Абстрактные	Ассоциативный массив Список Стек Очередь Двухсторонняя очередь Очередь с приоритетом Множество Мультимножество
Массив	Битовая карта Кольцевой буфер Динамический массив Хеш-таблица Разреженная матрица
	Ассоциативный список Связный список Список с пропусками Развёрнутый связный список Односвязный список Двусвязный список XOR-связный список
Деревья	B-дерево Двоичное дерево поиска AVL-дерево Красно-чёрное дерево Splay-дерево Куча Двоичная куча Биномиальная куча Фибоначчиева куча R-дерево R*-дерево R-дерево Гильберта Префиксное дерево
Графы	Бинарная диаграмма решений Ориентированный граф Ориентированный ациклический граф Гиперграф

Определение

Алгоритмическая реализация

Эвристики

Пример реализации

См. также

Литература

Ссылки

Теория множеств

Теория множеств

Same as Система непересекающихся множеств

Лес непересекающихся множеств

Пересечение множеств

Объединение множеств

Математики в теории множеств

Континуум (теория множеств)

Разность множеств

Парадоксы теории множеств

Теория множеств

Теория множеств

Объединение множеств

Пересечение множеств

Объединение множеств

Разность множеств

Пересечение множеств

Теория множеств

Теория множеств

Разность множеств

Разность множеств

Континуум (теория множеств)

Теория множеств

Теория множеств

Теория множеств

Объединение множеств

Пересечение множеств

Математики в теории множеств

Объединение множеств

Разность множеств

Пересечение множеств

Пересечение множеств