[Python教學] Pandas：資料處理的利器

2025/07/28 更新2024/12/20 發佈閱讀 8 分鐘

Pandas 是 Python 的一個強大數據操作與分析庫。它提供高效且靈活的資料結構，如 Series 和 DataFrame，適合用於資料清理、操作及分析。在本教學中，我們將深入探討 Pandas 的核心功能，並以範例展示如何進行資料處理。

如果還沒有準備好Python的環境的話，我們推薦超好用的Python集成開發環境－PyCharm！安裝教學文章連結點此：[Python教學] 開發環境安裝與設定教學－Pycharm。

1. Pandas 安裝與載入

如果尚未安裝 Pandas，可以使用 pip 進行安裝：

pip install pandas

安裝完成後，導入 Pandas：

import pandas as pd

2. Pandas 的核心資料結構

2.1 Series

Series 是一維的資料結構，類似於 Python 的 List 或 NumPy 的一維陣列，但具有索引。

import pandas as pd

# 建立 Series
data = pd.Series([10, 20, 30, 40], index=['A', 'B', 'C', 'D'])
print(data)

輸出：

A    10
B    20
C    30
D    40
dtype: int64

基本操作：

# 取值
print(data['A'])  # 10

# 過濾
print(data[data > 20])  # 篩選值大於 20 的元素

# 運算
print(data + 5)  # 每個元素加 5

2.2 DataFrame

DataFrame 是二維的資料結構，可以視為資料表格式。它是 Pandas 的核心資料結構。

# 建立 DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'Salary': [50000, 60000, 70000]
}
df = pd.DataFrame(data)
print(df)

輸出：

      Name  Age  Salary
0    Alice   25   50000
1      Bob   30   60000
2  Charlie   35   70000

3. 讀取與匯出資料

Pandas 支援多種資料格式的讀取與匯出，包括 CSV、Excel、JSON 等。

3.1 讀取資料

# 從 CSV 檔案讀取資料
df = pd.read_csv('data.csv')

# 從 Excel 檔案讀取資料
df = pd.read_excel('data.xlsx')

3.2 匯出資料

# 匯出為 CSV
df.to_csv('output.csv', index=False)

# 匯出為 Excel
df.to_excel('output.xlsx', index=False)

4. 資料檢視與摘要

檢視資料的結構與內容是資料分析的第一步。

4.1 基本資訊

print(df.head())       # 顯示前 5 筆資料
print(df.tail())       # 顯示後 5 筆資料
print(df.info())       # 顯示資料摘要
print(df.describe())   # 顯示數值欄位的統計摘要

4.2 檢查資料

print(df.columns)       # 查看欄位名稱
print(df.shape)         # 查看資料維度 (列數, 欄數)
print(df.isnull().sum())  # 檢查缺失值

5. 資料清理

資料清理是分析過程中的重要步驟，包含處理缺失值、重命名欄位、刪除重複值等。

5.1 處理缺失值

# 填補缺失值
df['Age'].fillna(df['Age'].mean(), inplace=True)  # 填補為平均值

# 刪除包含缺失值的列
df = df.dropna()

5.2 重命名欄位

df.rename(columns={'Name': 'Employee Name'}, inplace=True)

5.3 刪除重複值

df = df.drop_duplicates()

6. 資料篩選與操作

6.1 篩選資料

# 篩選特定條件
filtered_df = df[df['Age'] > 30]

# 篩選多條件
filtered_df = df[(df['Age'] > 25) & (df['Salary'] > 50000)]

6.2 新增與刪除欄位

# 新增欄位
df['Bonus'] = df['Salary'] * 0.1

# 刪除欄位
df.drop(columns=['Bonus'], inplace=True)

6.3 排序資料

# 依據某欄位排序
df.sort_values(by='Age', ascending=False, inplace=True)

7. 資料聚合與分組

Pandas 提供強大的分組與聚合功能，能輕鬆實現統計分析。

7.1 分組與聚合

# 按 'Department' 分組，並計算平均薪水
grouped = df.groupby('Department')['Salary'].mean()
print(grouped)

7.2 樞紐分析

# 建立樞紐表
pivot = pd.pivot_table(df, values='Salary', index='Department', columns='Gender', aggfunc='mean')
print(pivot)

8. 使用 Pandas 處理時間序列

Pandas 對時間序列資料提供良好支援。

# 將資料轉為日期型別
df['Date'] = pd.to_datetime(df['Date'])

# 篩選特定日期範圍
filtered_df = df[(df['Date'] > '2023-01-01') & (df['Date'] < '2023-12-31')]

9. Pandas 高效操作技巧

9.1 使用 Apply 函數

# 自訂函數應用於某欄位
df['Salary After Tax'] = df['Salary'].apply(lambda x: x * 0.8)

9.2 資料合併

# 左連接 (Left Join)
merged_df = pd.merge(df1, df2, on='Employee ID', how='left')

10. 小結

Pandas 是 Python 資料處理的強大工具，適合處理結構化數據。以下是使用 Pandas 的建議：

熟悉 Series 與 DataFrame 結構。
掌握資料清理、篩選、分組、聚合等基本操作。
利用 Pandas 與視覺化工具（如 Matplotlib、Seaborn）結合進行資料分析與展示。

Pandas 是一個靈活且高效的資料處理工具，透過多練習與實戰，將能夠快速掌握資料處理技能，並應用於多種場景。

#Python

#程式設計

#Pandas

追極光的北極熊｜軟體工程師的小天地Python教學

留言

留言分享你的想法！

追極光的北極熊｜軟體工程師的小天地

12會員

165內容數

歡迎來到我的部落格！這裡記錄了軟體工程師的日常生活點滴，並分享程式設計與演算法的實用教學。無論你是初學者還是有經驗的開發者，都能在這裡找到深入淺出的技術解析與實戰技巧。此外，我也會分享工作中的心路歷程與學習心得，讓你不僅學到技術，更能瞭解軟體開發的實際應用與挑戰。希望透過這個平台，能與你共同成長，激發對技術的熱情！

追極光的北極熊｜軟體工程師的小天地的其他內容

2025/04/28

[Python教學] 進階：性能優化與效能分析

當我們開發程式時，功能能正常運作固然重要，但在資料量變大或執行時間變長時，效能就成為不可忽視的一環。尤其在 Web 應用、資料分析或科學運算中，程式跑得快與否，直接影響使用者體驗與系統成本。

2025/04/28

[Python教學] 進階：性能優化與效能分析

2025/04/22

[Python教學] Tkinter：實戰專案 - 打造簡單記事本

嘿，大家好！上篇教學文章我們做出了一個待辦事項清單，已經有點小工具的感覺了吧？今天我們要再升級，來做個「簡單記事本」。這個專案不只可以寫東西，還能存檔、讀檔，甚至換字體大小，感覺就像自己寫了個迷你軟體！

2025/04/22

[Python教學] Tkinter：實戰專案 - 打造簡單記事本

2025/04/16

[Python教學] Tkinter：專案實戰與程式最佳化 - 從學習到應用

嘿，大家好！走到這一步，我們已經玩過 Tkinter 的基本招式、佈局、事件處理，還搞了些進階元件，應該有點信心了吧？今天我們要把這些功夫練成一套連招，來做個實用的「待辦事項清單」（To-Do List），順便聊聊怎麼把程式寫得更漂亮、更好用。準備好了嗎？這就上場啦！

2025/04/16

[Python教學] Tkinter：專案實戰與程式最佳化 - 從學習到應用

看更多

你可能也想看

哈斯的煉金工房

蝦皮購物11/11攻略：掌握領券、搶購、分潤三大關鍵，輕鬆放大你的荷包！

身為採購專家，當然不能錯過11/11購物節的超殺折扣！本文將帶你深入瞭解蝦皮11/11購物節的完整攻略，從必領的各種優惠券、商城折扣，到限時的搶購技巧，讓你買到手軟荷包也不哭泣。更重要的是，揭密蝦皮分潤計畫，教你如何零成本創業，透過分享商品連結，每月輕鬆加薪，開啟數位遊牧人生！

#蝦皮購物#蝦皮#購物節

2025/11/06

哈斯的煉金工房

蝦皮購物11/11攻略：掌握領券、搶購、分潤三大關鍵，輕鬆放大你的荷包！

#蝦皮購物#蝦皮#購物節

2025/11/06

寄放靈魂的閣樓

喜迎雙11購物節！加入蝦皮分潤計畫，輕鬆跨海購買心儀商品

雙11購物節將近，這次分享一些蝦皮海外賣場購物的步驟與注意事項，並且介紹雙11蝦皮購物的相關優惠；另外蝦皮分潤計畫持續招募新血中，只要分享購物連結即可獲得分潤，是很適合創作者的額外收入管道喔！

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

寄放靈魂的閣樓

喜迎雙11購物節！加入蝦皮分潤計畫，輕鬆跨海購買心儀商品

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

JayRay 的沙龍

【資料分析】Pandas 基礎操作語法彙整

pandas是用於資料操縱和分析的Python軟體庫。它建造在 NumPy 基礎上，並為操縱數值表格和時間序列，提供了資料結構和運算操作。 Pandas 的主要資料結構包含 Series 和 DataFrame 物件，由於 Pandas 本身基 Numpy 所以在使用大量資料運算時效能表現也優於原

#數據分析#資料分析#python

2024/07/31

JayRay 的沙龍

【資料分析】Pandas 基礎操作語法彙整

#數據分析#資料分析#python

2024/07/31

果農的沙龍

如何用Python將DataFrame中的資料擷取維新的DataFrame

如何用Python將DataFrame中的資料擷取維新的DataFrame？

#python#資料分析#數據分析

2024/05/27

果農的沙龍

如何用Python將DataFrame中的資料擷取維新的DataFrame

如何用Python將DataFrame中的資料擷取維新的DataFrame？

#python#資料分析#數據分析

2024/05/27

果農的沙龍

如何用Python製作相關表

本文介紹瞭如何使用 Python pandas 進行資料分析，包括如何使用 corr() 函數針對數字類型的欄位進行分析，以及如何刪除不需要的欄位和取得想要的小數位數。

2024/03/31

2024/03/31

Pandas 資料處理: 如何處理數據型態自動推斷的問題？

本文探討了在使用 pandas 處理資料時應注意的幾個關鍵點，以及如何減少因資料型態問題而產生的錯誤，確保資料的原始意義得以保留。主要包括Pandas 資料處理深入解析，尋找CSV之外的數據儲存方案，以及優化資料處理策略。

#數據#python#pandas

2024/03/06

Karen的沙龍

Pandas 資料處理: 如何處理數據型態自動推斷的問題？

#數據#python#pandas

2024/03/06

小松鼠的演算法樂園

Reshape Data: Concatenate 串接兩張資料表_Intro to Pandas

題目敘述題目會給定兩個pandas DataFrame作為輸入，要求我們將兩張資料表，依照原有的順序串接在一起。題目的原文敘述測試範例 Example 1: Input: df1 +------------+---------+-----+ | student_id | name

#pandas#dataframe#concat

2024/01/09

小松鼠的演算法樂園

Reshape Data: Concatenate 串接兩張資料表_Intro to Pandas

#pandas#dataframe#concat

2024/01/09

小松鼠的演算法樂園

Drop Missing Data 捨棄帶有缺失值的data row_Intro to Pandas

題目敘述題目會給定一個pandas DataFrame作為輸入，要求我們以原有的資料表name欄位為檢查基準，刪除有缺失值None的 data rows。題目的原文敘述測試範例 Example 1: Input: +------------+---------+-----+ | s

#pandas#python#dataframe

2024/01/09

小松鼠的演算法樂園

Drop Missing Data 捨棄帶有缺失值的data row_Intro to Pandas

#pandas#python#dataframe

2024/01/09

阿Han的沙龍

【🔒 Python實戰營 - Data Science 必修班】Pandas 資料清洗技 - 整形式

繼「【🔒 Python實戰營 - Data Science 必修班】Pandas 資料清洗技 - 填補式」之後，我們已經學會怎麼填補空缺資料了，那這個章節我們來教您如何對某些欄位有條件的整形，有時候我們的資料來源某些欄位資料格式不一，甚至型態都不是正規統一的值，此時我們就需要針對這些值進行一些處理

#python#Pandas#資料科學

2023/09/08

阿Han的沙龍

【🔒 Python實戰營 - Data Science 必修班】Pandas 資料清洗技 - 整形式

#python#Pandas#資料科學

2023/09/08

茶桁的沙龍

26. NumPy

Hi，大家好。我是茶桁。上一节课中，我们学习了matplotlib. 实际上，我们已经进入了数据可视化阶段。可是在上一节课中，所有的数据都是我们固定写好的，包括两个电影的数据展示的案例（柱状图和直方图），都是我们将数据手动写成了数据列表，然后直接使用。在我们平时的工作中，不太有那么多的机

2023/08/21

2023/08/21

【🔒 Python實戰營 - Data Science 必修班】Pandas 資料清洗技 - 填補式

繼「【Google Colab Python系列】資料處理神器 Pandas 起手式」之後，相信對於各位來說已經是小兒科了吧，沒關係！我們今天來增加一點點小挑戰，你知道嗎？ Pandas對於大部分人的第一印象就是「不就表格化而已，有什麼了不起？」、「幫我們整理格式轉換的介接器」...，但其實它不

#python#程式語言#Pandas

2023/08/14

阿Han的沙龍

【🔒 Python實戰營 - Data Science 必修班】Pandas 資料清洗技 - 填補式

#python#程式語言#Pandas

2023/08/14

阿Han的沙龍

【Google Colab Python系列】資料處理神器 Pandas Grouping & Reshapi

過往我們有介紹了「【Google Colab Python系列】資料處理神器 Pandas 起手式」，相信對於pandas的基本操作具有一定的基礎知識了，主要著重在基本的操作，讓我們快速篩選與分析資料，但真實的世界是有可能具有很多類型的資料集分別儲存，而不同的資料集又具有一些相似度，需

#python#Pandas#程式語言

2023/08/05

阿Han的沙龍

【Google Colab Python系列】資料處理神器 Pandas Grouping & Reshapi

#python#Pandas#程式語言

2023/08/05

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News