即時精選

[Python][NumPy] N維數組類型 ndarray，形狀，資料結構，索引切片介紹

螃蟹_crab

發佈於Python[基礎][應用][相關]

2025/03/09 更新2024/03/10 發佈閱讀 8 分鐘

NumPy 提供了一種 N 維數組類型 ndarray（N-dimensional array），它描述了相同類型的「數據類型」的集合。

ndarray 形狀大小

多維數組： ndarray 是一個 N 維數組，其中 N 可以是任意整數。一維數組是向量，二維數組是矩陣，以此類推

.`shape`

利用shape屬性查看，ndarray 在形狀描述了數組在每個維度上的大小。例如，形狀為 (2, 3) 的數組表示一個二維數組，其中維度為 2，每行的資料長度為3。

import numpy as np

# 創建一個一維數組
arr1 = np.array([1, 2, 3, 4, 5])

# 創建一個二維數組
arr2 = np.array([[1, 2, 3],
                 [4, 5, 6]])

print("arr1.shape:", arr1.shape)  # 輸出: (5,)
print("arr2.shape:", arr2.shape)  # 輸出: (2, 3)

ndarray 數據類型

所有 ndarray 中的元素都需要具有相同的數據類型。這有助於提高數組的效率，因為 NumPy 可以針對特定數據類型進行優化

ndarray 中的元素具有特定的數據類型，如整數、浮點數、複數等。可以使用 dtype 屬性查看或設置數據類型。

.`dtype`

使用 dtype 屬性查看， ndarray 的資料型態。

import numpy as np

# 創建一個ndarray
arr = np.array([1, 2, 3, 4, 5])

# 創建一個包含整數和浮點數的ndarray
arr_mixed = np.array([1, 2.5, 3, 4.2, 5])

# 查看ndarray的資料型態 
print("arr資料型態:", arr.dtype) #輸出 arr資料型態: int32
print("arr_mixed資料型態:", arr_mixed.dtype) #輸出 arr_mixed資料型態: float64

可以在創建 NumPy 數組的過程中使用 `dtype` 參數，明確指定數據類型

import numpy as np

# 使用 dtype 參數創建一個整數數組
arr_int = np.array([1, 2, 3, 4, 5], dtype=np.int32)

# 使用 dtype 參數創建一個浮點數數組
arr_float = np.array([1.1, 2.2, 3.3, 4.4, 5.5], dtype=np.float64)

# 使用 dtype 參數創建一個複數數組
arr_complex = np.array([1 + 2j, 3 + 4j, 5 + 6j], dtype=np.complex128)

# 查看數組的資料型態
print("整數數組的資料型態:", arr_int.dtype) #輸出 整數數組的資料型態: int32
print("浮點數數組的資料型態:", arr_float.dtype) #輸出 浮點數數組的資料型態: float64
print("複數數組的資料型態:", arr_complex.dtype) #輸出 複數數組的資料型態: complex128

分別使用 np.int32、np.float64 和 np.complex128 作為 dtype 參數來指定數據的類型。你可以根據需要選擇適當的 dtype，它包括整數、浮點數、複數等不同的類型。

這種明確指定數據類型的方式可以確保數據被正確地儲存和處理

ndarray 索引切片

在 NumPy 中，你可以使用索引和切片操作來訪問和修改 ndarray 中的元素。

以下是一些基本的索引和切片操作：

索引操作：

一維數組：

索引的元素編號是從0開始。

import numpy as np

arr = np.array([1, 2, 3, 4, 5])

# 獲取第三個元素
print(arr[2])  # 輸出: 3

# 修改第一個元素
arr[0] = 10

print(arr) #輸出 [10  2  3  4  5]

多維數組：

import numpy as np

arr_2d = np.array([[1, 2, 3],
                  [4, 5, 6]])

# 獲取第一行第二列的元素
print(arr_2d[0, 1])  # 輸出: 2

# 修改第二行第三列的元素
arr_2d[1, 2] = 99

print(arr_2d)

#輸出
# [[ 1  2  3]
#  [ 4  5 99]]

索引和切片操作在 NumPy 中是零起始的，這意味著第一個元素的索引是0

切片操作：

一維數組：

[:3] 表示選擇索引 0 到 2（不包括索引 3）的所有元素。

[-2:] 表示選擇倒數第二個元素到最後一個元素的所有元素。

import numpy as np

arr = np.array([1, 2, 3, 4, 5])

# 獲取前三個元素
print(arr[:3])  # 輸出: [1, 2, 3]

# 修改後兩個元素
arr[-2:] = 0

print(arr) #輸出 [1 2 3 0 0]

二維數組：

[0, :]：

這個切片表示選擇數組的第一行（索引為0的行）的所有列。
0 表示選擇的是第一行，而 : 表示選擇整個第一行的所有列。

[:, 1]：

這個切片表示選擇數組的所有行的第二列（索引為1的列）。
: 表示選擇整個所有行，而 1 表示選擇第二列。

[1:, 1:]：

這個切片表示選擇數組的第二行及之後的所有行，以及第二列及之後的所有列。
1: 表示選擇從索引1（第二行）開始的所有行，而 1: 表示選擇從索引1（第二列）開始的所有列。

import numpy as np

# 創建一個二維數組
arr_2d = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

# 獲取第一行
first_row = arr_2d[0, :]
print("第一行:", first_row)  # 輸出: [1, 2, 3]

# 獲取第二列
second_column = arr_2d[:, 1]
print("第二列:", second_column)  # 輸出: [2, 5, 8]

# 使用切片獲取子矩陣
submatrix = arr_2d[1:, 1:]
print("子矩陣:")
print(submatrix)
# 輸出:
# [[5, 6],
#  [8, 9]]

# 修改切片中的元素
arr_2d[1:, 1:] = 0
print("修改後的數組:")
print(arr_2d)
# 輸出:
# [[1, 2, 3],
#  [4, 0, 0],
#  [7, 0, 0]]

這些切片操作讓你能夠靈活地選擇 NumPy 數組中的不同子集，進行查看、修改或進行進一步的計算。

NumPy 中的 `ndarray` 之所以能夠提供高效的速度。

基於以下幾個關鍵：

底層實現： NumPy 的底層實現是用 C 語言編寫的。比 Python 更接近硬體，執行會更高效。
連續的內存布局： NumPy 的數組在記憶體中是連續存儲的，這使得對數組的訪問和操作更加高效。例如(一維的 NumPy 數組 [1, 2, 3, 4, 5]，這五個元素將按照順序依次存儲在記憶體中的相鄰位置，可以直接訪問數組中的每一個元素，而不需要額外的計算或跳躍)
廣播（Broadcasting）： NumPy 支持廣播操作，允許在不同形狀的數組之間進行操作。
向量化操作： NumPy 支持向量化操作，即對整個數組執行操作而無需使用顯式循環(for迴圈)。這使得在數組上進行數學和邏輯運算更加簡單，同時也更快速，因為底層操作可以在 C底層進行。
使用原生數據類型： NumPy 使用原生數據類型，而不是 Python 中的對象。這意味著數組中的元素在內存中是連續存儲的，且數據類型是已知的。相比於 Python 對象，這減少了內存開銷和運行時的開銷。
優化的算法： NumPy 中的許多操作都經過了高度優化，例如矩陣乘法、FFT（快速傅立葉變換）等。底層的優化算法使得這些操作在處理大規模數據時能夠更加高效。

參考文獻

螃蟹_crab的沙龍Python[基礎][應用][相關]Pd np re資料

留言

螃蟹_crab的沙龍

169會員

322內容數

本業是影像辨識軟體開發，閒暇時間進修AI相關內容，將學習到的內容寫成文章分享。興趣是攝影，踏青，探索未知領域。人生就是不斷的挑戰及自我認清，希望老了躺在床上不會後悔自己什麼都沒做。

螃蟹_crab的沙龍的其他內容

2024/09/14

[Python]生成器表達式(Generator Expression)介紹

生成器表達式是 Python 中一種更簡潔的語法，專門用來創建生成器。它的語法與列表生成式類似，但將列表生成式中的方括號 [] 替換為小括號 ()。生成器表達式與生成器函數類似，具有「惰性評估」的特性，因此它只在需要時才生成元素，從而節省記憶體。生成器的「惰性評估」（也叫延遲求值）指的是生成器不

2024/09/14

[Python]生成器表達式(Generator Expression)介紹

2024/09/01

[Python][Pandas]將日期欄位改為 DataFrame 的索引

包含著日期型資料在許多不同領域的分析中都非常重要，特別是當數據涉及隨時間變化的趨勢、模式或週期時，例如房價，股票價格分析等等。如何將一個日期欄位改為 DataFrame 的索引，你可以使用 set_index() 方法。實作範例數據來源處理步驟確保日期欄位是 datetime

2024/09/01

[Python][Pandas]將日期欄位改為 DataFrame 的索引

2024/09/01

[Python]pandas資料探索與清理_處理缺失值

為了讓資料更適合進行後續的分析、建立模型，模型的決策準確性，資料探索與清理是資料分析過程中非常重要的步驟，主要目的在於確保資料的品質和可靠性。因為前幾篇的例子中的資料，並沒有缺失值與重複值的部分，我另外找了一份有包含的資料來做案例分析，由於找到的資料沒有重複值的部分，故本文主要解釋處理缺失值的部

2024/09/01

[Python]pandas資料探索與清理_處理缺失值

看更多

你可能也想看

小松鼠的演算法樂園

集合操作: 尋找兩個陣列的差異值Diff of Two Arrays_Leetcode #2215 精選75題解析

題目敘述題目會給定我們兩個整數陣列作為輸入nums1, nums2，要求我們找出兩個陣列的差異值。找出在nums1但是不在nums2的元素，以陣列的形式放在answer[0]輸出。找出在nums2但是不在nums1的元素，以陣列的形式放在answer[1]輸出。題目的原文敘述

#leetcode#leetcode75#python

2024/02/29

小松鼠的演算法樂園

集合操作: 尋找兩個陣列的差異值Diff of Two Arrays_Leetcode #2215 精選75題解析

#leetcode#leetcode75#python

2024/02/29

小松鼠的演算法樂園

物以群分有幾個整除k的連續區間 Subarray Sums Divisible by K_Leetcode #974

題目敘述 Subarray Sums Divisible by K 給定一個整數陣列，請計算有幾個區間和能夠整除k的連續區間? 測試範例 Input: nums = [4,5,0,-2,-3,1], k = 5 Output: 7

#python#leetcode#algorithm

2024/06/09

小松鼠的演算法樂園

物以群分有幾個整除k的連續區間 Subarray Sums Divisible by K_Leetcode #974

題目敘述 Subarray Sums Divisible by K 給定一個整數陣列，請計算有幾個區間和能夠整除k的連續區間? 測試範例 Input: nums = [4,5,0,-2,-3,1], k = 5 Output: 7

#python#leetcode#algorithm

2024/06/09

釀電影，啜一口電影的美好。

往霧的更深處去──從《白色說書人》看轉型正義，與白色恐怖影視文本

見諸參與鄧伯宸口述，鄧湘庭於〈那個大霧的時代〉記述父親回憶，鄧伯宸因故遭受牽連，而案件核心的三人，在鄧伯宸記憶裡：「成立了成大共產黨，他們製作了五星徽章，印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單，以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿，另外還有手槍子彈十發。」

#釀電影#釀藝評#藝術評論

2026/05/07

釀電影，啜一口電影的美好。

往霧的更深處去──從《白色說書人》看轉型正義，與白色恐怖影視文本

#釀電影#釀藝評#藝術評論

2026/05/07

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：流動、跨域、變形的「生存之道」

當代名導基里爾．賽勒布倫尼科夫身兼電影、劇場與歌劇導演，其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後，他持續以創作回應專制體制的壓迫。《傳奇：帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析，解構賽勒布倫尼科夫如何利用影劇雙棲的特質，在荒謬世道中尋找藝術的「生存之道」。

#釀電影#釀評論#藝術評論

2026/02/28