不間斷 Python 挑戰 Day 18 - 集合 (Set)

閱讀時間約 11 分鐘
Python提供集合做為其資料結構,它就如同高中數學所學集合的概念,集合的內容一般來說是具有某種特性的事物的整體,例如考試分數及格的群體、數字1到100內的所有奇數、球箱內所有球的顏色等。因此,在一個集合中,每個元素的地位都是相同且無序,並且只能出現一次,集合和集合之間,也可以進行交集、聯集、差集等的操作。集合的元素必須是不可變的(immutable),也就是當該元素的物件被創造出來後,值沒辦法被改變,若修改其值會創造出一個新的物件,例如整數(int)、浮點數(float)、字串(string)、元組(tuple)等;可變的(mutable)物件則不能做為集合的元素,例如串列(list)、字典(dict)、集合(set)等。

集合

集合可以使用大括號「{ }」或是set()函數來建立。使用大括號時和字典類似,但只有鍵,沒有值,例如以下建立一個台灣直轄市的集合:
cities_set = {"台北市", "新北市", "桃園市", "台中市", "台南市", "高雄市"}
print(cities_set)
print(type(cities_set))
執行結果:
{'高雄市', '台北市', '台中市', '桃園市', '台南市', '新北市'}
<class 'set'>
前面提過集合中的元素只能出現一次,重複出現的元素會被自動刪除,例如:
cities_set = {"台北市", "新北市", "新北市", "桃園市", "台中市", "台南市", "高雄市"}
print(cities_set)
執行結果:
{'台中市', '台北市', '高雄市', '桃園市', '台南市', '新北市'}
使用set()函數建立集合的方式如下:
  • 內容為字串:
str_set = set("This is my marathon Python challenge.")
print(str_set)
執行結果,注意重複的字母只會出現一次:
{'o', 'r', 's', 'y', 'P', 'e', 'm', 'i', '.', 'n', 't', 'a', 'c', ' ', 'l', 'g', 'h', 'T'}
  • 內容為串列,將被轉換為集合:
list_set = set(["台北市", "新北市", "桃園市", "台中市", "台南市", "高雄市"])
print(list_set)
執行結果:
{'新北市', '高雄市', '台北市', '台中市', '台南市', '桃園市'}
  • 內容為字典,其鍵將被轉換為集合,其值會被忽略:
dict_set = set({"台北市": 2531659, "新北市": 4011586, "桃園市": 2272452, "台中市": 2814422, "台南市": 1863435, "高雄市": 2746939})
print(dict_set)
執行結果:
{'台中市', '台南市', '台北市', '新北市', '桃園市', '高雄市'}
  • 內容為元組,將被轉換為集合:
tuple_set = set(("台北市", "新北市", "桃園市", "台中市", "台南市", "高雄市"))
print(tuple_set)
執行結果:
{'新北市', '高雄市', '台北市', '台中市', '台南市', '桃園市'}

空集合

空集合的建立方式只能使用set()函數,若使用大括號則和建立空字典的方式相同,會被Python認為是字典的資料型態。
empty_set = {}
print(type(empty_set))
empty_set = set()
print(type(empty_set))
執行結果:
<class 'dict'>
<class 'set'>

增加與刪除集合元素

集合元素的內容是不可變的,但集合的元素可以被增加或刪除。
  • 使用add()方法來增加集合的元素
cities_set.add("新竹市")
print(cities_set)
執行結果:
{'台中市', '新竹市', '高雄市', '桃園市', '新北市', '台南市', '台北市'}
  • 使用remove()方法來刪除集合的元素
cities_set.remove("新竹市")
print(cities_set)
執行結果:
{'台中市', '台北市', '高雄市', '新北市', '桃園市', '台南市'}

集合的操作(聯集、交集、差集、對稱差集)

聯集(Union)

假設有A、B兩個集合,若想取得A、B兩集合內的所有元素可以使用聯集,Python的運算子符號為「|」。例如以下例子:A集合是3的倍數、B集合是5的倍數,則A、B聯集為3的倍數或5的倍數。
A_set = {3, 6, 9, 12, 15}
B_set = {5, 10, 15}
AB_union = A_set | B_set
print(AB_union)
執行結果:
{3, 5, 6, 9, 10, 12, 15}

交集(Intersection)

假設有A、B兩個集合,若想取得A、B兩集合內共同存在的元素可以使用交集,Python的運算子符號為「&」。承上範例,A、B聯集為3與5的公倍數。
A_set = {3, 6, 9, 12, 15}
B_set = {5, 10, 15}
AB_intersection = A_set & B_set
print(AB_intersection)
執行結果:
{15}

差集(difference)

假設有A、B兩個集合,若想取得屬於A集合但不屬於B集合的元素可以使用差集,Python的運算子符號為「-」。承上範例,A、B差集為3的倍數但不為5的倍數。
A_set = {3, 6, 9, 12, 15}
B_set = {5, 10, 15}
AB_difference = A_set - B_set
print(AB_difference)
執行結果:
{9, 3, 12, 6}

對稱差集(symmetric difference)

假設有A、B兩個集合,若想取得屬於A集合或是B集合的元素,但排除同時屬於A集合和B集合的元素,可以使用對稱差集,Python的運算子符號為「^」。承上範例,A、B的對稱差集為3的倍數或5的倍數,但不為3和5的公倍數。
A_set = {3, 6, 9, 12, 15}
B_set = {5, 10, 15}
AB_sym_difference = A_set ^ B_set
print(AB_sym_difference)
執行結果:
{3, 5, 6, 9, 10, 12}

子集合(subset)與父集合(superset)

假設有A、B兩個集合,若A集合的所有元素都存在於B集合,則稱A集合為B集合的子集合、B集合為A集合的父集合,Python用來判斷是否為子集合的函數為issubset()、用來判斷是否為父集合的函數為issuperset(),若相等則傳回True、不相等則傳回False。
A_set = {3, 6, 9, 12, 15}
B_set = {3, 5, 6, 9, 10, 12, 15}
print(f"Is A_set a subset of B_set? {A_set.issubset(B_set)}")
print(f"Is B_set a superset of A_set? {B_set.issuperset(A_set)}")
執行結果:
Is A_set a subset of B_set? True
Is B_set a superset of A_set? True

相等集合

Python用來判斷兩集合是否相等的運算子符號為「==」,若相等則傳回True、不相等則傳回False。
A_set = {3, 6, 9, 12, 15}
B_set = {3, 5, 6, 9, 10, 12, 15}
C_set = {3, 6, 9, 12, 15}
print(f"Is A_set the same as B_set? {A_set == B_set}")
print(f"Is A_set the same as C_set? {A_set == C_set}")
執行結果:
Is A_set the same as B_set? False
Is A_set the same as C_set? True

使用for迴圈迭代

集合可以使用for迴圈迭代,但必須記得集合是無序的資料結構,不能使用索引值來取值。
for city in cities_set:
  print(city, end=" ")
執行結果:
高雄市 桃園市 台南市 新北市 台北市 台中市 

集合生成

集合和for迴圈結合,可以簡潔的方式產生元組,例如前面例子的A_set,我們手動鍵入1到15範圍內的3的倍數,其實也可以這樣產生:
A_set = {num for num in range(1, 16) if num % 3 == 0}
print(A_set)
執行結果:
{3, 6, 9, 12, 15}

程式範例

avatar-img
47會員
36內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Wei-Jie Weng的沙龍 的其他內容
Python依據變數有效的範圍可以區分為全域變數(Global variable)或區域變數(Local variable)。在函數內宣告的變數為區域變數,有效範圍只有在函數內,函數外部無法引用這個變數;在函數以外宣告的變數為全域變數,它的有效範圍為整個檔案,並且在函數內部也可以引用這個變數。
這篇文章將利用之前所學過的一些東西,包括if敘述、串列、while迴圈、函數等等的觀念,來實作一個撲克牌的小遊戲-21點。
在前面的文章中我們學習了關於字典的基本用法,今天再討論更多關於字典的其它用法,以及它和串列、元組等的關聯。
在程式設計中,我們會使用到一些固定不會變動的資料內容,例如一年的月份、物體的邊長、過去一周的氣溫等等,使用串列的結構固然也可以用來儲存這些資料,但串列可以被新增或刪除,不能有效保護這類不可變動的資料。因此,Python也提供了另一種形式的資料結構,稱為元組,它的資料結構和串列相同,但資料的內容不可變
當我們查字典時,會先找到想查詢的單字在字典裡的位置,才能在那個位置找到單字的定義;在Python中,也有一個類似的資料結構稱作字典,字典的鍵(key)就對應到我們要查詢的單字,字典的值(value)則是該單字的定義。
隨著程式的功能愈來愈複雜,程式碼也愈來愈多,若程式從頭寫到尾沒有任何的段落,可讀性會愈來愈差,甚至會發現同樣的一段程式碼重覆很多遍,因為類似的功能區塊在程式中可能會一再出現。這樣的程式碼不利於多人的協作開發,即使是寫作者本身在一段時間後回來看,可能也難以一眼就掌握程式的主要架構。
Python依據變數有效的範圍可以區分為全域變數(Global variable)或區域變數(Local variable)。在函數內宣告的變數為區域變數,有效範圍只有在函數內,函數外部無法引用這個變數;在函數以外宣告的變數為全域變數,它的有效範圍為整個檔案,並且在函數內部也可以引用這個變數。
這篇文章將利用之前所學過的一些東西,包括if敘述、串列、while迴圈、函數等等的觀念,來實作一個撲克牌的小遊戲-21點。
在前面的文章中我們學習了關於字典的基本用法,今天再討論更多關於字典的其它用法,以及它和串列、元組等的關聯。
在程式設計中,我們會使用到一些固定不會變動的資料內容,例如一年的月份、物體的邊長、過去一周的氣溫等等,使用串列的結構固然也可以用來儲存這些資料,但串列可以被新增或刪除,不能有效保護這類不可變動的資料。因此,Python也提供了另一種形式的資料結構,稱為元組,它的資料結構和串列相同,但資料的內容不可變
當我們查字典時,會先找到想查詢的單字在字典裡的位置,才能在那個位置找到單字的定義;在Python中,也有一個類似的資料結構稱作字典,字典的鍵(key)就對應到我們要查詢的單字,字典的值(value)則是該單字的定義。
隨著程式的功能愈來愈複雜,程式碼也愈來愈多,若程式從頭寫到尾沒有任何的段落,可讀性會愈來愈差,甚至會發現同樣的一段程式碼重覆很多遍,因為類似的功能區塊在程式中可能會一再出現。這樣的程式碼不利於多人的協作開發,即使是寫作者本身在一段時間後回來看,可能也難以一眼就掌握程式的主要架構。
你可能也想看
Google News 追蹤
Thumbnail
在 Python 中,tuple 與 List有一個關鍵的不同點:tuple 是不可變的,這意味著一旦創建了 tuple,就無法更改其內容。 這與 List的可變性形成了對比,list 可以新增、刪除或修改元素。 元素的意思: 元素:指的是 List 中的每一個獨立的項目或值。
Thumbnail
今天要實作和體驗的是拼單字的小遊戲,類似小時候在報紙、英文童書、或著電子辭典的小遊戲,一開始都是空白,隨著使用者拼對而逐漸顯示原本的單字樣貌,直到整個單字拼出來為止。 場景: 電腦隨機從單字庫裡面撈一個單字出來。 讓使用者扮演玩家去玩拼單字的遊戲。
Thumbnail
題目敘述 Kth Distinct String in an Array 給定一個輸入陣列arr 和 參數k 請返回第k個出現恰好一次的陣列元素。
在檢查列表中含有tuple的座標點時,若要給其他演算法做運算時若有其中有tuple有空值時,就會報錯。 本文主要介紹兩種方法可以檢查是否有空值 程式範例1 positon_list =[(42,123),(None,None),(22,11)] for cord in positon_lis
Thumbnail
Array可以說是各種語言除了基本型別之外,最常用的資料型別與容器之一了。 Array 這種連續格子狀的資料結構,在Python要怎麼表達呢? 建立一個空的陣列 最簡單也最直接的寫法就是 array = [] # Python list [] 就對應到大家熟知的array 陣列型態的資料結
Thumbnail
當我們在做很多處理時,結果可能會是List包住一些數值,例如找輪廓或連通域分析時,沒有剛好的特徵可能就會有List含(空值得)形式出現。 為了避免報錯,我們就要額外先做一些處理,先做判斷是否有值在往下一個階段。 all 和 any 是 Python 中用於檢查可迭代物件(如清單、元組、集合等)
Thumbnail
古有四大名著,現今Python四大容器🤣 哪四個?list串列,tuple元組,dict字典,set集合。 那這四個怎麼分? 一起來看看吧! (以下有手寫與上機實際測試請付費觀看) 以上我精心整理主要會使用到的功能 當然python功能太多了,肯定不只。 實際操作: 大概就這樣?(
Thumbnail
題目敘述 題目的情境是設計並且實現一個包含所有正整數的數據流,以set集合的方式存在。 數據流 = {1, 2, 3, 4, ..., ∞} 要求我們去實現定義好的function介面: SmallestInfiniteSet()建構子,初始化這個包含所有正整數的數據流。 int po
Thumbnail
本文介紹了Python中zip與enumerate函式的使用,以及它們的語法說明和程式範例。zip函式允許同時迭代多個可迭代對象,這使得程式碼更簡潔;而enumerate函式則在迭代時,提供元素的索引,使得實用工具,尤其是當需要追蹤元素的位置時。
Thumbnail
列表(List)和元組(Tuple)都是 Python 中用來存儲集合元素的數據結構,兩者看起來很像,在初學時很容易搞混,所以觀念要建立好。 可以把列表(List)和元組(Tuple)想像成是一個容器,什麼元素都可以塞
Thumbnail
在 Python 中,tuple 與 List有一個關鍵的不同點:tuple 是不可變的,這意味著一旦創建了 tuple,就無法更改其內容。 這與 List的可變性形成了對比,list 可以新增、刪除或修改元素。 元素的意思: 元素:指的是 List 中的每一個獨立的項目或值。
Thumbnail
今天要實作和體驗的是拼單字的小遊戲,類似小時候在報紙、英文童書、或著電子辭典的小遊戲,一開始都是空白,隨著使用者拼對而逐漸顯示原本的單字樣貌,直到整個單字拼出來為止。 場景: 電腦隨機從單字庫裡面撈一個單字出來。 讓使用者扮演玩家去玩拼單字的遊戲。
Thumbnail
題目敘述 Kth Distinct String in an Array 給定一個輸入陣列arr 和 參數k 請返回第k個出現恰好一次的陣列元素。
在檢查列表中含有tuple的座標點時,若要給其他演算法做運算時若有其中有tuple有空值時,就會報錯。 本文主要介紹兩種方法可以檢查是否有空值 程式範例1 positon_list =[(42,123),(None,None),(22,11)] for cord in positon_lis
Thumbnail
Array可以說是各種語言除了基本型別之外,最常用的資料型別與容器之一了。 Array 這種連續格子狀的資料結構,在Python要怎麼表達呢? 建立一個空的陣列 最簡單也最直接的寫法就是 array = [] # Python list [] 就對應到大家熟知的array 陣列型態的資料結
Thumbnail
當我們在做很多處理時,結果可能會是List包住一些數值,例如找輪廓或連通域分析時,沒有剛好的特徵可能就會有List含(空值得)形式出現。 為了避免報錯,我們就要額外先做一些處理,先做判斷是否有值在往下一個階段。 all 和 any 是 Python 中用於檢查可迭代物件(如清單、元組、集合等)
Thumbnail
古有四大名著,現今Python四大容器🤣 哪四個?list串列,tuple元組,dict字典,set集合。 那這四個怎麼分? 一起來看看吧! (以下有手寫與上機實際測試請付費觀看) 以上我精心整理主要會使用到的功能 當然python功能太多了,肯定不只。 實際操作: 大概就這樣?(
Thumbnail
題目敘述 題目的情境是設計並且實現一個包含所有正整數的數據流,以set集合的方式存在。 數據流 = {1, 2, 3, 4, ..., ∞} 要求我們去實現定義好的function介面: SmallestInfiniteSet()建構子,初始化這個包含所有正整數的數據流。 int po
Thumbnail
本文介紹了Python中zip與enumerate函式的使用,以及它們的語法說明和程式範例。zip函式允許同時迭代多個可迭代對象,這使得程式碼更簡潔;而enumerate函式則在迭代時,提供元素的索引,使得實用工具,尤其是當需要追蹤元素的位置時。
Thumbnail
列表(List)和元組(Tuple)都是 Python 中用來存儲集合元素的數據結構,兩者看起來很像,在初學時很容易搞混,所以觀念要建立好。 可以把列表(List)和元組(Tuple)想像成是一個容器,什麼元素都可以塞