如何用Python繪製散布圖與迴歸線

閱讀時間約 3 分鐘

首先這是我們的資料:

import pandas as pd
data = pd.read_csv("opendata.csv")
raw-image

先整理資料,只取用校舍基地大小大於0的資料:

data = data[data["可使用校地-校舍基地(平方公尺)"]!=0]

接著我們開始繪圖:

import matplotlib

#選擇中文字體
matplotlib.rc("font",family="Microsoft YaHei")

from matplotlib import pyplot as plt

#繪製圖的大小
plt.figure(figsize=(6,6))

#繪製一個位於包含1X1個子圖的圖且位置在(0,0)的子圖
ax0 = plt.subplot2grid((1,1,),(0,0),colspan=1,rowspan=1)

#--------------------------------

#建立x軸資料
ax0_x = data["可使用校地-校舍基地(平方公尺)"]/10000

#建立y軸資料
ax0_y = data["學生宿舍床位數(床)"]

#建立稍候要調整顏色時會用到的List
data["顏色"] = list(map(lambda x: "green" if x == "國立大學" else ("blue" if x == "私立大學" else "red"), data["學校類型"]))

#--------------------------------

#開始繪製散布圖
ax0.scatter(x=ax0_x, y=ax0_y, c= data["顏色"], marker="p", alpha=0.7)

#建立坐標軸名稱
ax0.set_xlabel("可使用校地-校舍基地(萬平方公尺)")
ax0.set_ylabel("學生宿舍床位數(床)")

#--------------------------------

import numpy as np

#利用polyfit將係數存在變數p中
p = np.polyfit(ax0_x, ax0_y, 1)

#建立迴歸線的x軸資料(由0~散布圖的x軸資料的最大值並遞增排序)
p_x = range(0,max(ax0_x.sort_values().astype(int)))

#繪製迴歸線
plt.plot(p_x,np.polyval(p,p_x),color="darkgray",linestyle="--",alpha=0.5)

#--------------------------------

#建立標題
plt.title("可使用校地 X 學生宿舍床位數")
raw-image



avatar-img
4會員
60內容數
我是果農,這裡有我的人資職涯經驗分享,與我菜鳥般的Python資料分析筆記,還有一些讀書心得,希望對大家有幫助。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
果農的沙龍 的其他內容
這篇文章介紹如何使用Python整理資料成百分比資料以及繪製百分比堆疊直條圖。
透過分析臺灣好行的公開資料,分享如何用Python繪製折線圖
本文介紹了如何使用資料樞紐分析的功能來整理所需的資料,並設定圖表的中文字型,最後提供了繪圖的程式碼範例。
本文介紹瞭如何使用 Python pandas 進行資料分析,包括如何使用 corr() 函數針對數字類型的欄位進行分析,以及如何刪除不需要的欄位和取得想要的小數位數。
如何用Python匯入大批Excel檔案? os.listdir建立資料夾內[檔案名稱.副檔名]之列表 利用迴圈將所有檔案匯入Python 用pandas.concat合併所有DataFrame
這篇文章介紹如何使用Python整理資料成百分比資料以及繪製百分比堆疊直條圖。
透過分析臺灣好行的公開資料,分享如何用Python繪製折線圖
本文介紹了如何使用資料樞紐分析的功能來整理所需的資料,並設定圖表的中文字型,最後提供了繪圖的程式碼範例。
本文介紹瞭如何使用 Python pandas 進行資料分析,包括如何使用 corr() 函數針對數字類型的欄位進行分析,以及如何刪除不需要的欄位和取得想要的小數位數。
如何用Python匯入大批Excel檔案? os.listdir建立資料夾內[檔案名稱.副檔名]之列表 利用迴圈將所有檔案匯入Python 用pandas.concat合併所有DataFrame
你可能也想看
Google News 追蹤
Thumbnail
在資料分析過程中,透過衡量變數之間的線性或非線性關係,能有效探索數據集,篩選出重要特徵,並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性,以及利用互資訊評估變數之間的依賴程度,幫助資料科學家在建模過程中選擇適當的變數,提升模型效果。
Thumbnail
Python資料視覺化在數據分析中扮演關鍵角色,透過視覺化捕捉數據模式、趨勢和異常,透過Matplotlib等工具創建專業圖表變相對簡單和高效。
Thumbnail
在數據分析的工作中,處理 CSV 檔案是一項基礎且重要的技能,CSV 格式的檔案是以純文字形式儲存表格數據,簡潔的結構使其普遍應用於數據儲存。本文將介紹如何使用Python 來讀取、處理和儲存 CSV 檔案。
Thumbnail
在資料分析過程中,透過衡量變數之間的線性或非線性關係,能有效探索數據集,篩選出重要特徵,並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性,以及利用互資訊評估變數之間的依賴程度,幫助資料科學家在建模過程中選擇適當的變數,提升模型效果。
Thumbnail
Python資料視覺化在數據分析中扮演關鍵角色,透過視覺化捕捉數據模式、趨勢和異常,透過Matplotlib等工具創建專業圖表變相對簡單和高效。
Thumbnail
在數據分析的工作中,處理 CSV 檔案是一項基礎且重要的技能,CSV 格式的檔案是以純文字形式儲存表格數據,簡潔的結構使其普遍應用於數據儲存。本文將介紹如何使用Python 來讀取、處理和儲存 CSV 檔案。