[Python教學] Seaborn:高階資料視覺化工具-課後練習詳解

閱讀時間約 8 分鐘

以下是針對上一篇文章中的課後練習中每個問題的詳細解答,包括程式碼和結果解釋。


練習 1:繪製每天平均小費的柱狀圖

題目

使用內建資料集 tips,繪製每天平均小費的柱狀圖。

解答

  1. 使用 Seaborn 的 barplot 繪製圖表。
  2. 設置 x 為天數 (day),y 為小費 (tip)。
  3. 設置標題和坐標軸標籤以增加可讀性。
import seaborn as sns
import matplotlib.pyplot as plt

# 載入內建資料集
tips = sns.load_dataset("tips")

# 繪製柱狀圖
sns.barplot(x="day", y="tip", hue="day", data=tips, errorbar="sd", palette="Blues", legend=False)
plt.title("Average Tip by Day")
plt.xlabel("Day of the Week")
plt.ylabel("Average Tip ($)")
plt.show()
raw-image


結果解釋

  • 每根柱子代表某一天的平均小費。
  • 將 hue="day" 加入 sns.barplot 呼叫,將每個“day”值對應到不同的顏色。
  • 如果不需要圖例,可以透過設定 legend=False 來避免顯示圖例。
  • 調色板使用 Blues,讓圖表更加美觀。

練習 2:生成相關係數的熱力圖

題目

使用自己的數據,生成一個相關係數的熱力圖,視覺化數據的相關性。

解答

  1. 建立一個 Pandas DataFrame,模擬自己的數據。
  2. 計算數據的相關係數矩陣。
  3. 使用 Seaborn 的 heatmap 繪製熱力圖。
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# 建立自定義數據
data = {
"Math_Score": [80, 85, 88, 92, 70, 75, 78],
"Science_Score": [85, 88, 84, 91, 68, 77, 80],
"English_Score": [78, 82, 85, 89, 73, 76, 77]
}

df = pd.DataFrame(data)

# 計算相關係數矩陣
corr = df.corr()

# 繪製熱力圖
plt.figure(figsize=(8, 6))
sns.heatmap(corr, annot=True, cmap="coolwarm", fmt=".2f", linewidths=0.5)
plt.title("Correlation Heatmap")
plt.show()
raw-image


結果解釋

  • 熱力圖中的每個格子代表兩組變數之間的相關係數。
  • annot=True 在每個格子中顯示具體的相關係數值。
  • cmap="coolwarm" 使用藍-紅色調,讓相關性強弱更易辨識。

練習 3:結合 Matplotlib 與 Seaborn 製作報表

題目

將 Seaborn 的繪圖與 Matplotlib 的自訂功能結合,製作更複雜的報表,例如增加多個圖表。

解答

  1. 使用 Matplotlib 的 plt.subplot 方法,構建多個子圖。
  2. 在每個子圖中使用 Seaborn 繪製不同的圖表。
  3. 添加全局標題和註解。
import seaborn as sns
import matplotlib.pyplot as plt

# 加載內建資料集
tips = sns.load_dataset("tips")

# 設置畫布大小
plt.figure(figsize=(14, 8))

# 子圖 1:散點圖
plt.subplot(2, 2, 1)
sns.scatterplot(x="total_bill", y="tip", hue="sex", data=tips)
plt.title("Scatter Plot: Total Bill vs Tip")
plt.xlabel("Total Bill ($)")
plt.ylabel("Tip ($)")

# 子圖 2:直方圖
plt.subplot(2, 2, 2)
sns.histplot(tips["total_bill"], bins=20, kde=True, color="orange")
plt.title("Distribution of Total Bill")
plt.xlabel("Total Bill ($)")
plt.ylabel("Frequency")

# 子圖 3:箱型圖
plt.subplot(2, 2, 3)
sns.boxplot(x="day", y="total_bill", hue="sex", data=tips, palette="Set2")
plt.title("Box Plot: Total Bill by Day and Sex")
plt.xlabel("Day of the Week")
plt.ylabel("Total Bill ($)")

# 子圖 4:條形圖
plt.subplot(2, 2, 4)
sns.barplot(x="day", y="tip", data=tips, errorbar="sd", palette="coolwarm")
plt.title("Average Tip by Day")
plt.xlabel("Day of the Week")
plt.ylabel("Average Tip ($)")

# 添加全局標題
plt.suptitle("Comprehensive Data Visualization with Seaborn", fontsize=16)
plt.tight_layout(rect=[0, 0, 1, 0.95]) # 調整佈局避免重疊
plt.show()
raw-image


結果解釋

  • 報表展示了同一數據的多角度視覺化,便於進行數據分析。
  • plt.subplot 分別繪製 4 個子圖。
  • 使用 Matplotlib 的 suptitle 添加全局標題。
  • tight_layout 自動調整子圖間距,避免圖表重疊。

總結

通過這些練習,你可以:

  1. 熟悉 Seaborn 的基礎功能和不同圖表的繪製。
  2. 掌握如何結合 Matplotlib 添加額外的自訂功能。
  3. 為數據分析過程提供更專業和清晰的視覺化工具。

建議讀者將這些範例應用於自己的數據,進一步理解 Seaborn 和資料視覺化的強大之處!

歡迎來到我的部落格!這裡記錄了軟體工程師的日常生活點滴,並分享程式設計與演算法的實用教學。無論你是初學者還是有經驗的開發者,都能在這裡找到深入淺出的技術解析與實戰技巧。此外,我也會分享工作中的心路歷程與學習心得,讓你不僅學到技術,更能瞭解軟體開發的實際應用與挑戰。希望透過這個平台,能與你共同成長,激發對技術的熱情!
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Seaborn 是一個基於 Matplotlib 的高階資料視覺化庫,專為統計圖表設計。與 Matplotlib 相比,Seaborn 提供了更簡潔的語法、更美觀的預設樣式,以及與 Pandas 的緊密整合,非常適合用於數據分析和探索性資料分析 (EDA)。
Matplotlib 是 Python 中最流行且功能強大的資料視覺化工具之一。它能夠生成各種靜態、動態及互動式的圖表,是資料分析與科學計算的重要組成部分。在本教學中,我們將詳細介紹 Matplotlib 的核心功能,並以範例逐步展示如何繪製基本與進階圖表。
Pandas 是 Python 的一個強大數據操作與分析庫。它提供高效且靈活的資料結構,如 Series 和 DataFrame,適合用於資料清理、操作及分析。在本教學中,我們將深入探討 Pandas 的核心功能,並以範例展示如何進行資料處理。
在這篇文章中,我們將深入探討 Python 中的非同步程式設計,特別是使用 asyncio 模組來實現事件循環和協程。這將幫助你理解如何在 I/O 密集型任務中提高效率,並充分利用 Python 的非同步特性。
在這篇文章中,我們將深入探討 Python 中的平行程式設計,特別是使用 threading 和 multiprocessing 模組來實現多執行緒和多進程的應用。這些技術可以幫助我們充分利用現代 CPU 的多核心架構,提高程式的執行效率。
Seaborn 是一個基於 Matplotlib 的高階資料視覺化庫,專為統計圖表設計。與 Matplotlib 相比,Seaborn 提供了更簡潔的語法、更美觀的預設樣式,以及與 Pandas 的緊密整合,非常適合用於數據分析和探索性資料分析 (EDA)。
Matplotlib 是 Python 中最流行且功能強大的資料視覺化工具之一。它能夠生成各種靜態、動態及互動式的圖表,是資料分析與科學計算的重要組成部分。在本教學中,我們將詳細介紹 Matplotlib 的核心功能,並以範例逐步展示如何繪製基本與進階圖表。
Pandas 是 Python 的一個強大數據操作與分析庫。它提供高效且靈活的資料結構,如 Series 和 DataFrame,適合用於資料清理、操作及分析。在本教學中,我們將深入探討 Pandas 的核心功能,並以範例展示如何進行資料處理。
在這篇文章中,我們將深入探討 Python 中的非同步程式設計,特別是使用 asyncio 模組來實現事件循環和協程。這將幫助你理解如何在 I/O 密集型任務中提高效率,並充分利用 Python 的非同步特性。
在這篇文章中,我們將深入探討 Python 中的平行程式設計,特別是使用 threading 和 multiprocessing 模組來實現多執行緒和多進程的應用。這些技術可以幫助我們充分利用現代 CPU 的多核心架構,提高程式的執行效率。
你可能也想看
Google News 追蹤
Thumbnail
Python資料視覺化在數據分析中扮演關鍵角色,透過視覺化捕捉數據模式、趨勢和異常,透過Matplotlib等工具創建專業圖表變相對簡單和高效。
Thumbnail
本文在介紹如何用Python繪製各點大小不同的散布圖及用箭頭標註特殊點
Thumbnail
這篇文章介紹如何使用Python整理資料成百分比資料以及繪製百分比堆疊直條圖。
Thumbnail
本文介紹了如何使用資料樞紐分析的功能來整理所需的資料,並設定圖表的中文字型,最後提供了繪圖的程式碼範例。
Thumbnail
Python資料視覺化在數據分析中扮演關鍵角色,透過視覺化捕捉數據模式、趨勢和異常,透過Matplotlib等工具創建專業圖表變相對簡單和高效。
Thumbnail
本文在介紹如何用Python繪製各點大小不同的散布圖及用箭頭標註特殊點
Thumbnail
這篇文章介紹如何使用Python整理資料成百分比資料以及繪製百分比堆疊直條圖。
Thumbnail
本文介紹了如何使用資料樞紐分析的功能來整理所需的資料,並設定圖表的中文字型,最後提供了繪圖的程式碼範例。