☘用Python來實現Disjoint Set (併查集/ Union-Find)

小松鼠

發佈於動手學Python 從小專案體驗樂趣

2024/08/30 更新2024/08/29 發佈閱讀 1 分鐘

Joel & Jasmin Førestbird on Unsplash

之前，已經學會了Linked List, 並且知道如何用Linked List來實作Queue 和 Stack。

今天，我們將用Python list來實現Disjoint Set (併查集，另外也有人稱之為Union-Find)。

Disjoint Set適合用於處理一些子集合的合併和根節點的查找操作。
這種資料結構在圖論中非常有用，特別是在解決連通性相關問題的應用。

定義

一個森林狀的資料結構。

一開始，每個ID對應到一顆樹，根節點都指向自己。

整體看，就是有n顆樹(Tree)構成的森林(Forest)。

支援的操作與介面

DS.init(self, size)

初始化Disjoint Set，大小為參數size所指定

一開始，每個ID對應到一顆樹，根節點都指向自己。

整體看，就是有n顆樹(Tree)構成的森林(Forest)。

DS.find(x)

尋找ID x所在的根節點(代表屬於哪個集合)

DS.union(x, y)

合併ID x所在的集合和 ID y所在的集合。

通常合併時，會以集合的size(也有課本稱之為rank)為依據。

size小的合併到size大的。

如果size相同，則合併到前者x所在的集合。

優點

1.使用path-compression之後，可以在 O (α(N)) ~ O(1) 常數時間內find()。

2.使用path-compression之後，可以在 O (α(N)) ~ O(1) 常數時間內union()。

缺點

1.相對不直覺，需要以陣列或字典去記錄每個ID的根結點。

Disjoint Set的class定義與建構子(初始化函式)

class DisjointSet:

    def __init__(self, size):
        self.parent = list(range(size))
        self.rank = [1] * size

Disjoint Set常見的function實現

1.find(x)

尋找ID x所在的根節點(代表屬於哪個集合)。

並且沿路順便更新，把長輩節點的根結點都指向最上層的root。

這種技巧稱之為path compression。

時間複雜度: O (α(N)) ~ O(1) 常數時間

    def find(self, x):
        if self.parent[x] != x:
            self.parent[x] = self.find(self.parent[x])  # 路徑壓縮
        return self.parent[x]

2.union(x, y)

合併ID x所在的集合和 ID y所在的集合。

通常合併時，會以集合的size(也有課本稱之為rank)為依據。

size小的合併到size大的。

如果size相同，則合併到前者x所在的集合。

時間複雜度: O (α(N)) ~ O(1) 常數時間

    def union(self, x, q):
        rootX = self.find(x)
        rootY = self.find(q)

        if rootX != rootY:
            # 按size (rank)合併
            if self.rank[rootX] > self.rank[rootY]:
                self.parent[rootY] = rootX
            elif self.rank[rootX] < self.rank[rootY]:
                self.parent[rootX] = rootY
            else:
                self.parent[rootY] = rootX
                self.rank[rootX] += 1

完整的Disjoint Set實作和程式碼，
底層是Python dictionary。

class DisjointSet:
    def __init__(self, size):
        self.parent = list(range(size))
        self.rank = [1] * size

    def find(self, x):
        if self.parent[x] != x:
            self.parent[x] = self.find(self.parent[x])  # 路徑壓縮
        return self.parent[x]

    def union(self, x, q):
        rootX = self.find(x)
        rootY = self.find(q)

        if rootX != rootY:
            # 按size (rank)合併
            if self.rank[rootX] > self.rank[rootY]:
                self.parent[rootY] = rootX
            elif self.rank[rootX] < self.rank[rootY]:
                self.parent[rootX] = rootY
            else:
                self.parent[rootY] = rootX
                self.rank[rootX] += 1

def test():
    # Example
    
    # ID = 0, 1, 2, ..., 9
    ds = DisjointSet(10)
    
    print("After initialization")
    for i in range(10):
        print(f"root of {i} = {ds.find(i)}")
        
    ds.union(1, 2)
    
    print("\nAfter union(1, 2)")
    for i in range(10):
        print(f"root of {i} = {ds.find(i)}")
    
    ds.union(3, 4)
    
    print("\nAfter union(1, 2) and union(3, 4)")
    for i in range(10):
        print(f"root of {i} = {ds.find(i)}")
      
    ds.union(1, 3)
    print("\nAfter union(1, 2), union(3, 4), union(1, 3)")
    for i in range(10):
        print(f"root of {i} = {ds.find(i)}")

if __name__ == '__main__':
    test()

測試輸出

After initialization
root of 0 = 0
root of 1 = 1
root of 2 = 2
root of 3 = 3
root of 4 = 4
root of 5 = 5
root of 6 = 6
root of 7 = 7
root of 8 = 8
root of 9 = 9

After union(1, 2)
root of 0 = 0
root of 1 = 1
root of 2 = 1
root of 3 = 3
root of 4 = 4
root of 5 = 5
root of 6 = 6
root of 7 = 7
root of 8 = 8
root of 9 = 9

After union(1, 2) and union(3, 4)
root of 0 = 0
root of 1 = 1
root of 2 = 1
root of 3 = 3
root of 4 = 3
root of 5 = 5
root of 6 = 6
root of 7 = 7
root of 8 = 8
root of 9 = 9

After union(1, 2), union(3, 4), union(1, 3)
root of 0 = 0
root of 1 = 1
root of 2 = 1
root of 3 = 1
root of 4 = 1
root of 5 = 5
root of 6 = 6
root of 7 = 7
root of 8 = 8
root of 9 = 9

結語

Disjoint Set其實就是對應到數學中的集合、集合合併的操作。

讀著可以試著舉幾個小範例，用紙筆追蹤驗算法來驗證輸出結果，是否和預期相符合。

Disjoin Set相關的演算法練習題與詳解

🗿字典應用: Most Stones Removed with Same Row or Column_LC#947

小松鼠的演算法樂園動手學Python 從小專案體驗樂趣從範例學python小松鼠的演算法樂園動手學Python 從小專案體驗樂趣資料結構&演算法

留言

留言分享你的想法！

小松鼠的演算法樂園

96會員

427內容數

由有業界實戰經驗的演算法工程師，手把手教你建立解題的框架，一步步寫出高效、清晰易懂的解題答案。著重在讓讀者啟發思考、理解演算法，熟悉常見的演算法模板。深入淺出地介紹題目背後所使用的演算法意義，融會貫通演算法與資料結構的應用。在幾個經典的題目融入一道題目的多種解法，或者同一招解不同的題目，擴展廣度，並加深印象。

小松鼠的演算法樂園的其他內容

2024/10/10

🔗Python deque 與 Queue 相關的常用操作

從Python 內建deque資料結構的角度切入，同時了解deque 與 FIFO Queue相關的function用法。 collections.deque是一種兩端點皆可進出的雙端佇列在兩端點高效地在O(1)常數時間內添加和刪除元素。這使得deque非常適合實現FIFO Queue

2024/10/10

🔗Python deque 與 Queue 相關的常用操作

2024/09/27

⭕⭕❌❌回憶殺 python實現井字遊戲可線上玩+AI對戰

井字遊戲(OOXX)的遊戲描述 Tic Tac Toe（井字遊戲）是經典的雙人棋盤遊戲，在一個3x3的方格中進行。每回合兩個玩家輪流選一個位置，先讓自己的符號（是 X 或 O）在水平線、垂直線或對角線上連成一線的玩家宣告獲勝。

2024/09/27

⭕⭕❌❌回憶殺 python實現井字遊戲可線上玩+AI對戰

2024/09/23

🔯從Python來學BFS廣度優先探索與等權圖的最短路徑Shortest Path

深入探討圖(Graph)的基本概念及最短路徑Shortest Path的尋找。我們專注於廣度優先搜尋(BFS)演算法，以等權圖的最短路徑為例，詳細說明如何利用BFS從起點擴散到終點，並且提供詳細的程式碼範例。透過實作，讀者能夠更清楚理解圖論及BFS的應用，並體會水波紋擴散模型的重要性。

2024/09/23

🔯從Python來學BFS廣度優先探索與等權圖的最短路徑Shortest Path

看更多

你可能也想看

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15