[Python][Numpy]unique找出陣列中相同的數值

2024/06/06 更新2024/06/06 發佈閱讀 4 分鐘

np.unique 是 NumPy 庫中的一個函數，用於找出陣列中的相同的數值。這個函數可以單純過濾只取唯一值出來，也可以選擇性地返回這些唯一值在原始陣列中的中的索引和計數。

函式

unique = np.unique(ar, return_index=False, return_inverse=False, return_counts=False, axis=None)

參數

ar: 輸入數組。可以是任何形狀的陣列。
return_index: 如果設置為 True，將返回唯一值在原始陣列中的索引。
return_inverse: 如果設置為 True，將返回原始數組重構為唯一值陣列的索引。
return_counts: 如果設置為 True，將返回唯一值的計數。
axis: 如果設置，則沿指定軸查找唯一值。

返回值

unique: 唯一值的陣列，按照排序順序返回。
unique_indices: （可選）唯一值在原始數組中的第一個出現索引。
unique_inverse: （可選）用於重構原始數組的索引。
unique_counts: （可選）唯一值的計數。

使用範例

單純使用找出唯一值

import numpy as np

# 1D
a = np.unique([1, 1, 2, 2, 3, 3])
print(a) # [1 2 3]

# 2D
b = np.array([[1, 0, 0], [1, 0, 0], [2, 3, 4]])
b_res = np.unique(b, axis=0)
print(b_res) 
#[[1 0 0]
# [2 3 4]]

取出唯一值的索引

返回出兩個陣列，第一個u包含的是唯一值，第二個indices包含的是這些唯一值的索引。

import numpy as np

a = np.array(['a', 'b', 'b', 'c', 'a'])
u, indices = np.unique(a, return_index=True)

print(u) #['a' 'b' 'c']
print(indices) #[0 1 3]
print(a[indices]) #['a' 'b' 'c']

重構索引數組

import numpy as np

a = np.array([1, 2, 6, 4, 2, 3, 2])
u, indices = np.unique(a, return_inverse=True)
print(u) # [1 2 3 4 6]
print(indices) #[0 1 4 3 1 2 1]
print(u[indices]) #[1 2 6 4 2 3 2]

分步解釋

原始數組 a:
```
a = np.array([1, 2, 6, 4, 2, 3, 2])
```
- 原始數組 a 包含了以下元素: [1, 2, 6, 4, 2, 3, 2]
調用 np.unique 並返回唯一值和重構索引:
```
u, indices = np.unique(a, return_inverse=True)
```
- u 是 a 中的唯一值，並且是排序後的結果。
- indices 是一個數組，它包含了 a 中每個元素在 u 中的位置索引。
唯一值數組 u:
```
print(u)  # [1 2 3 4 6]
```
- u 包含了 a 中的唯一值，並且是排序後的結果: [1, 2, 3, 4, 6]
重構索引數組 indices:
```
print(indices)  # [0 1 4 3 1 2 1]
```
- indices 包含了 a 中每個元素在 u 中的位置索引。1 在 u 中的位置是 02 在 u 中的位置是 16 在 u 中的位置是 44 在 u 中的位置是 32 在 u 中的位置是 13 在 u 中的位置是 22 在 u 中的位置是 1
重構原始數組 a:
```
print(u[indices])  # [1 2 6 4 2 3 2]
```
- 使用 u 和 indices 可以重構原始數組 a。
- u[indices] 會將 indices 中的每個索引替換為 u 中相應的位置的值，從而得到原始數組 a。

計算唯一值出現的次數

返回出兩個陣列，第一個values包含的是唯一值，第二個counts包含的是這些唯一值出現的次數。

import numpy as np

a = np.array([1, 2, 6, 4, 2, 3, 2])
values, counts = np.unique(a, return_counts=True)
print(values) #[1 2 3 4 6]
print(counts) #[1 3 1 1 1]

參考文獻

螃蟹_crab的沙龍Python[基礎][應用][相關]Pd np re資料

留言

留言分享你的想法！

螃蟹_crab的沙龍

154會員

300內容數

本業是影像辨識軟體開發，閒暇時間進修AI相關內容，將學習到的內容寫成文章分享。興趣是攝影，踏青，探索未知領域。人生就是不斷的挑戰及自我認清，希望老了躺在床上不會後悔自己什麼都沒做。

螃蟹_crab的沙龍的其他內容

2024/09/14

[Python]生成器表達式(Generator Expression)介紹

生成器表達式是 Python 中一種更簡潔的語法，專門用來創建生成器。它的語法與列表生成式類似，但將列表生成式中的方括號 [] 替換為小括號 ()。生成器表達式與生成器函數類似，具有「惰性評估」的特性，因此它只在需要時才生成元素，從而節省記憶體。生成器的「惰性評估」（也叫延遲求值）指的是生成器不

2024/09/14

[Python]生成器表達式(Generator Expression)介紹

2024/09/01

[Python][Pandas]將日期欄位改為 DataFrame 的索引

包含著日期型資料在許多不同領域的分析中都非常重要，特別是當數據涉及隨時間變化的趨勢、模式或週期時，例如房價，股票價格分析等等。如何將一個日期欄位改為 DataFrame 的索引，你可以使用 set_index() 方法。實作範例數據來源處理步驟確保日期欄位是 datetime

2024/09/01

[Python][Pandas]將日期欄位改為 DataFrame 的索引

2024/09/01

[Python]pandas資料探索與清理_處理缺失值

為了讓資料更適合進行後續的分析、建立模型，模型的決策準確性，資料探索與清理是資料分析過程中非常重要的步驟，主要目的在於確保資料的品質和可靠性。因為前幾篇的例子中的資料，並沒有缺失值與重複值的部分，我另外找了一份有包含的資料來做案例分析，由於找到的資料沒有重複值的部分，故本文主要解釋處理缺失值的部

2024/09/01

[Python]pandas資料探索與清理_處理缺失值

看更多

你可能也想看

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15