首先,這是我們的資料
import pandas as pd
data = pd.read_csv("高雄市勞資爭議案件.csv")
接著就可以用assign函數建立新欄位:
import numpy as np
data.assign(
#可以做欄位間的計算
平均每件爭議人數 = round(data["爭議人數人合計"]/data["爭議件數件"],2),
完整資訊 = data["年別"].astype("str") +"年" + " " + data["爭議件數件"].astype("str") + "件",
#可以直接加入平均數
歷年平均爭議件數 = data["爭議件數件"].mean().round(2),
#可以直接加入總數
歷年爭季件數合計 = data["爭議件數件"].sum(),
#可以加入常數項
常數項 = 1000,
市別 = "高雄市",
#可以加入缺失值
缺失值 = np.nan,
#可以加入list
序號 = [1,2,3,4,5,6,7,8,9,10,11,12]
)