【資料分析】Pandas 基礎操作語法彙整

更新於 發佈於 閱讀時間約 29 分鐘
raw-image

pandas是用於資料操縱和分析的Python軟體庫。它建造在 NumPy 基礎上,並為操縱數值表格和時間序列,提供了資料結構和運算操作。

pandas 提供了高效且靈活的數據結構和數據操作工具,主要包括 SeriesDataFrame 兩種數據結構。Series 是一維標籤數組,而 DataFrame 是二維的表格數據結構,類似於 Excel 表格。

Pandas 將 Python 打造成一個強大的資料處理工具,讓資料科學家和分析師能夠快速地對數據進行清洗、分析和可視化,從而提高工作效率並做出數據驅動的決策。


# 可使用目錄功能快速確認要閱覽的主題


Pandas 資料基礎操作語法

import pandas as pd

### 創健一個範例資料集 ###
data = pd.DataFrame({
'col1': [1, 2, 3, 4],
'col2': [5, 6, 7, 8],
'col3': [9, 10, 11, 12]
'name': ['Jerry','Tom','Bob','Amy']
})


資料查看

# 查看該資料集的前五筆資料
data.head()

# 查看該資料集的前八筆資料
data.head(8)

# 查看該資料集的後五筆資料
data.tail()

# 查看該資料集的後八筆資料
data.tail(8)

# 查看該資料的形狀
data.shape

# 查看該資料集的描述性統計信息和數據摘要
data.describe()

# 查看該資料集的結構性摘要信息
data.info()

# 查看該資料集的dtype屬性
data.dtypes​

# 查看所有欄位中最大的值
data.max()

# 指定 age 欄位,查看該欄位最大的值​
data['age'].max()

# 計算指定資料中,每個類別或數值出現的次數​
titanic["Pclass"].value_counts()

# 以 Pclass 做分組,計算每個類別或數值出現的次數​
titanic.groupby("Pclass")["Pclass"].count()

# 在 data 中,object 類型的欄位,計算每欄出現的唯一值的數量
data.select_dtypes(["object"]).nunique()


資料選擇

# 選擇第一列資料
row = data.loc[0]

# 選擇第一列和第二列資料
rows = data.loc[[0, 1]]

# 選擇第一列和第二列,以及第一欄和第二欄的資料
subset = data.loc[[0, 1], ['col1', 'col2']]

# ':'表示所有行,​'col2':'col3'表示'col2'到'col3'的所有列
subset2 = data.loc[:,'col2':'col3']

# loc 方法可以按照標籤選擇資料,而 iloc 方法可以按照索引位置選擇資料。
# ​選擇第 10 行到第 25 行(不含第 25 行)的數據,以及第 3 列到第 5 列(不含第 5 列)的數據。
titanic.iloc[9:25, 2:5]

# 將特定 Column 定義為 index
# 選取 "Jerry" 和 "Amy" 兩筆資料的 "col2" 和 "col3" 這兩個欄位
data.set_index('name', inplace=True)
result = df.loc[['Jerry', 'Amy'], ['col2', 'col3']]
result

# 選擇 col1 的所有資料(Series)
data['col1']

# 選擇 col1、col3 的所有資料(Dataframe)
data[['col1','col3']]

# ​選擇前三列的所有資料(Dataframe)
data[0:3]

# 將特定 Column 定義為 index ,利用 Row 名稱進行選取
data.set_index('name', inplace=True)
data['Jerry':'Bob']

# 刪除特定欄位
data = data.drop('欄位名稱', axis=1)

# 刪除多個欄位
data = data.drop(['欄位名稱1', '欄位名稱2'], axis=1)

# 使用 inplace=True 直接修改原始 DataFrame
data.drop('欄位名稱', axis=1, inplace=True)


資料過濾

# 選擇 col1 大於 10 的資料
subset = data.query('col1 > 10')

# 選擇 col1 大於 10 且 col2 小於 20 的資料
subset = data[(data['col1'] > 10) & (data['col2'] < 20)]

# 使用多個條件組合過濾資料
mask = (data['col2'] > 7) & (data['name'] == 'Tom')
data[mask]

# ​以鐵達尼號資料為例,選擇 Pclass 欄位中,Pclass 等於 2 跟 3 的所有資料
class_23 = titanic[titanic["Pclass"].isin([2, 3])]

# ​以鐵達尼號資料為例,選擇 age 欄位中沒有缺失值的所有資料
age_no_na = titanic[titanic["Age"].notna()]


資料排序

# 按照 col1 排序,預設為升序排序(從小到大)
data.sort_values('col1')

# 按照 col1 和 col2 排序
data.sort_values(['col1', 'col2'])

# 按照 col1 升序排列,col2 降序排列(從大到小)
data.sort_values(['col1', 'col2'], ascending=[True, False])

# 按照索引進行排序
data.sort_index()

# ​按照 Age 來排序,預設為升序排序(從小到大)
titanic.sort_values(by="Age")

# ​先按照 Pclass 來排序,在按照 Age 來排序,並指定以降序排序(從大到小)
titanic.sort_values(by=['Pclass', 'Age'], ascending=False)


資料去重

# 去除重複資料
data.drop_duplicates()


資料計算

import pandas as pd

# 計算​ titanic 資料中的 Age 平均值
titanic["Age"].mean()

# 計算 ​titanic 資料中的 Age 以及 Fare 的中位數
titanic[["Age", "Fare"]].median()

# 創建兩個DataFrame物件
data1 = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'city': ['New York', 'Paris', 'London', 'Berlin']}
df1 = pd.DataFrame(data1)

data2 = {'name': ['Eva', 'Frank', 'Grace', 'Henry'],
'age': [29, 23, 37, 31],
'city': ['Rome', 'Sydney', 'Tokyo', 'Moscow']}
df2 = pd.DataFrame(data2)

# 進行加法
print(df1 + df2)

"""
name age city
0 AliceEva 54 New YorkRome
1 BobFrank 55 ParisSydney
2 CharlieGrace 55 LondonTokyo
3 DavidHenry 78 BerlinMoscow
"""

# 按照 "city" 的值進行分組,並對每個城市的人口數、平均年齡、平均薪資進行統計分析
grouped = df.groupby('city')
result = grouped.agg({'name': 'count', 'age': 'mean', 'salary': 'mean'})
print(result)

"""
name age salary
city
Berlin 1 47.000000 100000.000000
London 1 18.000000 25000.000000
New York 2 24.000000 42500.000000
Paris 2 31.500000 77500.000000
"""

# 對鐵達尼號資料,選擇 Sex 和 Age 列,以 Sex 作為分組做平均,回傳 DataFram
​titanic[["Sex", "Age"]].groupby("Sex").mean()

"""​
Age
Sex
female 27.915709
male 30.726645
"""

# ​對鐵達尼號資料,以 Sex 為分組,只針對數值資料做平均
titanic.groupby("Sex").mean(numeric_only=True)

# ​對鐵達尼號資料,以 Sex 為分組,做 Age 的平均,回傳 series
titanic.groupby("Sex")["Age"].mean()

# ​對鐵達尼號資料,以 Sex 和 Pclass 為分組,做 Fare 的平均,回傳 series
​titanic.groupby(["Sex", "Pclass"])["Fare"].mean()


增加、刪除資料欄位

# 創建​一個新欄位,資料為 col1 欄位的數值*2 
data["新增欄位名"] = data["col1"] * 2

# 創建​一個新欄位,計算 col1 與 col2 的比率
data["投資報酬率"] = (data["投資淨損益"] / data["投入資金"])

# 使用 loc 新增一行
dfta.loc[2] = ['第一欄位內容', '第二欄位內容']

# 新增一列並且想保持原有 DataFrame 不變,使用 assign 新增一列
data = pd.DataFrame({ 'Name': ['Alice', 'Bob'], 'Age': [25, 30] })
data_new = data.assign(City=['New York', 'Los Angeles'])

# 刪除特定欄位 'Column_Name'
data = data.drop(columns=['Column_Name'])

# 刪除特定行(根據索引)
data = data.drop(index=[0]) # 刪除第0行

# 如果要一次刪除多行
data = data.drop(index=[0, 1]) # 刪除第0和第1行

# 刪除特定欄位 'Column_Name',直接在原 DataFrame 上修改
data.drop(columns=['Column_Name'], inplace=True)


資料合併與重組(concat)

使用 concat() 方法可以將多個DataFrame物件沿著指定的軸合併在一起。

import pandas as pd

# 創建兩個DataFrame物件
data1 = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'city': ['New York', 'Paris', 'London', 'Berlin']}
df1 = pd.DataFrame(data1)

data2 = {'name': ['Eva', 'Frank', 'Grace', 'Henry'],
'age': [29, 23, 37, 31],
'city': ['Rome', 'Sydney', 'Tokyo', 'Moscow']}
df2 = pd.DataFrame(data2)

# 沿著上下合併
print(pd.concat([df1, df2], axis=0))

"""
name age city
0 Alice 25 New York
1 Bob 32 Paris
2 Charlie 18 London
3 David 47 Berlin
0 Eva 29 Rome
1 Frank 23 Sydney
2 Grace 37 Tokyo
3 Henry 31 Moscow
"""

# 沿著左右合併
print(pd.concat([df1, df2], axis=1))

"""
name age city name age city
0 Alice 25 New York Eva 29 Rome
1 Bob 32 Paris Frank 23 Sydney
2 Charlie 18 London Grace 37 Tokyo
3 David 47 Berlin Henry 31 Moscow
"""

# 合併兩個DataFrame後,增加一層索引,方便辨識資料來自哪一個資料集
pd.concat([df1,df2],keys=['data1','data2'])

"""
name age city
data1 0 Alice 25 New York
1 Bob 32 Paris
2 Charlie 18 London
3 David 47 Berlin
data2 0 Eva 29 Rome
1 Frank 23 Sydney
2 Grace 37 Tokyo
3 Henry 31 Moscow
"""



資料合併與重組(merge)

使用 merge() 方法可以根據指定的欄位將兩個DataFrame物件合併在一起。

import pandas as pd

# 創建兩個DataFrame物件
data1 = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'city': ['New York', 'Paris', 'London', 'Berlin']}
df1 = pd.DataFrame(data1)

data2 = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'salary': [5000, 6000, 7000, 8000]}
df2 = pd.DataFrame(data2)

# 根據name欄位合併,若兩個 DataFrame 沒有匹配到相同 name,則不會合併
print(pd.merge(df1, df2, on='name'))


"""
name age city salary
0 Alice 25 New York 5000
1 Bob 32 Paris 6000
2 Charlie 18 London 7000
3 David 47 Berlin 8000
"""

# 根據name欄位合併, 所有 df1 資料都會被保留
# 若 df1 跟 df2 有無匹配到的資料,合併後的空欄位會顯示 NaN
print(pd.merge(df1, df2, how='left', on='name'))


資料合併與重組(merge) (續)

import pandas as pd

data1 = {'employee_id': [1, 2, 3, 4],
         'name': ['Alice', 'Bob', 'Charlie', 'David']}
df1 = pd.DataFrame(data1)

data2 = {'id': [1, 2, 3, 4],
         'salary': [5000, 6000, 7000, 8000]}
df2 = pd.DataFrame(data2)

# 當​欲合併的兩個 DataFrame 有列名稱不同,但內容相同的情況
# ​使用 left_on 和 right_on 來指定需要對齊的列。
merged_df = pd.merge(df1, df2, left_on='employee_id', right_on='id')
merged_df

"""
employee_id name id salary
0 1 Alice 1 5000
1 2 Bob 2 6000
2 3 Charlie 3 7000
3 4 David 4 8000
"""
import pandas as pd

data1 = {'first_name': ['Alice', 'Bob', 'Charlie', 'David'],
'last_name': ['Smith', 'Brown', 'Johnson', 'Williams'],
'age': [25, 32, 18, 47]}
df1 = pd.DataFrame(data1)

data2 = {'fname': ['Alice', 'Bob', 'Charlie', 'David'],
'lname': ['Smith', 'Brown', 'Johnson', 'Williams'],
'salary': [5000, 6000, 7000, 8000]}
df2 = pd.DataFrame(data2)

# ​通過指定 left_on 和 right_on 來正確地合併這兩個DataFrame。
merged_df = pd.merge(df1, df2, left_on=['first_name', 'last_name'], right_on=['fname', 'lname'])
merged_df

"""
first_name last_name age fname lname salary
0 Alice Smith 25 Alice Smith 5000
1 Bob Brown 32 Bob Brown 6000
2 Charlie Johnson 18 Charlie Johnson 7000
3 David Williams 47 David Williams 8000
"""


資料合併與重組(join)

使用 join() 方法可以將兩個DataFrame物件按照索引合併在一起。

import pandas as pd

# 創建兩個DataFrame物件
data1 = {'age': [25, 32, 18, 47],
'city': ['New York', 'Paris', 'London', 'Berlin']}
df1 = pd.DataFrame(data1, index=['Alice', 'Bob', 'Charlie', 'David'])

data2 = {'salary': [5000, 6000, 7000, 8000]}
df2 = pd.DataFrame(data2, index=['Alice', 'Bob', 'Charlie', 'David'])

# 按照索引合併
print(df1.join(df2))

"""
age city salary
Alice 25 New York 5000
Bob 32 Paris 6000
Charlie 18 London 7000
David 47 Berlin 8000
"""


分組資料處理(groupby)

使用 groupby() 方法可以將 DataFrame 分組後對每個組進行操作。

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma', 'Frank'],
'age': [25, 32, 18, 47, 23, 31],
'gender': ['female', 'male', 'female', 'male', 'female', 'male'],
'city': ['New York', 'Paris', 'London', 'Berlin', 'New York', 'Paris'],
'salary': [50000, 80000, 25000, 100000, 35000, 75000]}
df = pd.DataFrame(data)


# 按照 "city" 的值進行分組,並對每個城市的人口數、平均年齡、平均薪資進行統計分析
grouped = df.groupby('city')
result = grouped.agg({'name': 'count', 'age': 'mean', 'salary': 'mean'})
print(result)

"""
name age salary
city
Berlin 1 47.000000 100000.000000
London 1 18.000000 25000.000000
New York 2 24.000000 42500.000000
Paris 2 31.500000 77500.000000
"""

# 對鐵達尼號資料,選擇 Sex 和 Age 列,以 Sex 作為分組做平均,回傳 DataFram
​titanic[["Sex", "Age"]].groupby("Sex").mean()

"""​
Age
Sex
female 27.915709
male 30.726645
"""

# ​對鐵達尼號資料,以 Sex 為分組,只針對數值資料做平均
titanic.groupby("Sex").mean(numeric_only=True)

# ​對鐵達尼號資料,以 Sex 為分組,做 Age 的平均,回傳 series
titanic.groupby("Sex")["Age"].mean()

# ​對鐵達尼號資料,以 Sex 和 Pclass 為分組,做 Fare 的平均,回傳 series
​titanic.groupby(["Sex", "Pclass"])["Fare"].mean()

# 對鐵達尼號資料,以 Pclass 做分組,計算每個類別或數值出現的次數​
titanic.groupby("Pclass")["Pclass"].count()

# 對鐵達尼號資料,以 Sex 做分組,做 Age 的平均,返回一個與原始 DataFrame 大小相同的 series
titanic.groupby("Sex")["Age"].transform("mean")


資料匯入與匯出

import pandas as pd

# 匯入csv檔​(DataFrame)
titanic = pd.read_csv("data/titanic.csv")

# 將資料匯出為excel​
titanic.to_excel("titanic.xlsx", sheet_name="passengers", index=False)


資料 columns 更名

# 更改 columns 名稱,使用字典,鍵為原名,值為更改後的名
​air_quality_renamed = air_quality.rename(
...: columns={
...: "station_antwerp": "BETR801",
...: "station_paris": "FR04014",
...: "station_london": "London Westminster",
...: }
...: )

# ​將 columns 名稱全部更改微小寫
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)


其它常用指令

待補

留言
avatar-img
留言分享你的想法!
avatar-img
JayRay 的沙龍
11會員
23內容數
JayRay 的沙龍的其他內容
2025/01/21
本文章提供深度學習(Deep Learning)、深度神經網絡(DNN)、卷積神經網絡(CNN)和遞歸神經網絡(RNN)的簡介,並包含它們的定義、應用場景、基本結構、工作原理、優缺點和Python範例。
Thumbnail
2025/01/21
本文章提供深度學習(Deep Learning)、深度神經網絡(DNN)、卷積神經網絡(CNN)和遞歸神經網絡(RNN)的簡介,並包含它們的定義、應用場景、基本結構、工作原理、優缺點和Python範例。
Thumbnail
2025/01/05
本篇文章提供描述性統計的完整指南,涵蓋集中趨勢、離散趨勢和數據分佈等重要概念,並附上豐富的實務應用案例與 Python 資料視覺化參考連結,協助讀者快速瞭解數據分析的基礎知識。
Thumbnail
2025/01/05
本篇文章提供描述性統計的完整指南,涵蓋集中趨勢、離散趨勢和數據分佈等重要概念,並附上豐富的實務應用案例與 Python 資料視覺化參考連結,協助讀者快速瞭解數據分析的基礎知識。
Thumbnail
2024/12/25
Naive Bayes是一種基於貝葉斯定理的機器學習分類演算法,適用於文本分類、垃圾郵件檢測及情感分析等任務。雖然假設特徵之間相互獨立,這在現實中不常成立,但其高效計算與穩定性使得在小數據集及高維度特徵空間中表現良好。
Thumbnail
2024/12/25
Naive Bayes是一種基於貝葉斯定理的機器學習分類演算法,適用於文本分類、垃圾郵件檢測及情感分析等任務。雖然假設特徵之間相互獨立,這在現實中不常成立,但其高效計算與穩定性使得在小數據集及高維度特徵空間中表現良好。
Thumbnail
看更多
你可能也想看
Thumbnail
介紹朋友新開的蝦皮選物店『10樓2選物店』,並分享方格子與蝦皮合作的分潤計畫,註冊流程簡單,0成本、無綁約,推薦給想增加收入的讀者。
Thumbnail
介紹朋友新開的蝦皮選物店『10樓2選物店』,並分享方格子與蝦皮合作的分潤計畫,註冊流程簡單,0成本、無綁約,推薦給想增加收入的讀者。
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
pandas是用於資料操縱和分析的Python軟體庫。它建造在 NumPy 基礎上,並為操縱數值表格和時間序列,提供了資料結構和運算操作。 Pandas 的主要資料結構包含 Series 和 DataFrame 物件,由於 Pandas 本身基 Numpy 所以在使用大量資料運算時效能表現也優於原
Thumbnail
pandas是用於資料操縱和分析的Python軟體庫。它建造在 NumPy 基礎上,並為操縱數值表格和時間序列,提供了資料結構和運算操作。 Pandas 的主要資料結構包含 Series 和 DataFrame 物件,由於 Pandas 本身基 Numpy 所以在使用大量資料運算時效能表現也優於原
Thumbnail
本文介紹瞭如何使用 Python pandas 進行資料分析,包括如何使用 corr() 函數針對數字類型的欄位進行分析,以及如何刪除不需要的欄位和取得想要的小數位數。
Thumbnail
本文介紹瞭如何使用 Python pandas 進行資料分析,包括如何使用 corr() 函數針對數字類型的欄位進行分析,以及如何刪除不需要的欄位和取得想要的小數位數。
Thumbnail
本文探討了在使用 pandas 處理資料時應注意的幾個關鍵點,以及如何減少因資料型態問題而產生的錯誤,確保資料的原始意義得以保留。主要包括Pandas 資料處理深入解析,尋找CSV之外的數據儲存方案,以及優化資料處理策略。
Thumbnail
本文探討了在使用 pandas 處理資料時應注意的幾個關鍵點,以及如何減少因資料型態問題而產生的錯誤,確保資料的原始意義得以保留。主要包括Pandas 資料處理深入解析,尋找CSV之外的數據儲存方案,以及優化資料處理策略。
Thumbnail
題目敘述 題目會給定一個pandas DataFrame作為輸入,要求我們以原有的資料表為基礎,融合不同的資料欄位。 以product作為index,融合quarter_1,quarter_2,quarter_3,quarter_4 這四個欄位,並且重新命名為quarter,並且將數值欄位名稱重
Thumbnail
題目敘述 題目會給定一個pandas DataFrame作為輸入,要求我們以原有的資料表為基礎,融合不同的資料欄位。 以product作為index,融合quarter_1,quarter_2,quarter_3,quarter_4 這四個欄位,並且重新命名為quarter,並且將數值欄位名稱重
Thumbnail
題目敘述 題目會給定兩個pandas DataFrame作為輸入,要求我們將兩張資料表,依照原有的順序串接在一起。 題目的原文敘述 測試範例 Example 1: Input: df1 +------------+---------+-----+ | student_id | name
Thumbnail
題目敘述 題目會給定兩個pandas DataFrame作為輸入,要求我們將兩張資料表,依照原有的順序串接在一起。 題目的原文敘述 測試範例 Example 1: Input: df1 +------------+---------+-----+ | student_id | name
Thumbnail
題目敘述 題目會給定一個pandas DataFrame作為輸入,要求我們回傳資料表的前3個Row。 題目的原文敘述 測試範例 Example 1: Input: DataFrame employees +-------------+-----------+-------------
Thumbnail
題目敘述 題目會給定一個pandas DataFrame作為輸入,要求我們回傳資料表的前3個Row。 題目的原文敘述 測試範例 Example 1: Input: DataFrame employees +-------------+-----------+-------------
Thumbnail
繼「【🔒 Python實戰營 - Data Science 必修班】Pandas 資料清洗技 - 填補式」之後,我們已經學會怎麼填補空缺資料了,那這個章節我們來教您如何對某些欄位有條件的整形,有時候我們的資料來源某些欄位資料格式不一,甚至型態都不是正規統一的值,此時我們就需要針對這些值進行一些處理
Thumbnail
繼「【🔒 Python實戰營 - Data Science 必修班】Pandas 資料清洗技 - 填補式」之後,我們已經學會怎麼填補空缺資料了,那這個章節我們來教您如何對某些欄位有條件的整形,有時候我們的資料來源某些欄位資料格式不一,甚至型態都不是正規統一的值,此時我們就需要針對這些值進行一些處理
Thumbnail
Hi,大家好。我是茶桁。 上一节课中,我们学习了matplotlib. 实际上,我们已经进入了数据可视化阶段。 可是在上一节课中,所有的数据都是我们固定写好的,包括两个电影的数据展示的案例(柱状图和直方图),都是我们将数据手动写成了数据列表,然后直接使用。 在我们平时的工作中,不太有那么多的机
Thumbnail
Hi,大家好。我是茶桁。 上一节课中,我们学习了matplotlib. 实际上,我们已经进入了数据可视化阶段。 可是在上一节课中,所有的数据都是我们固定写好的,包括两个电影的数据展示的案例(柱状图和直方图),都是我们将数据手动写成了数据列表,然后直接使用。 在我们平时的工作中,不太有那么多的机
Thumbnail
繼「【Google Colab Python系列】 資料處理神器 Pandas 起手式」之後,相信對於各位來說已經是小兒科了吧,沒關係! 我們今天來增加一點點小挑戰,你知道嗎? Pandas對於大部分人的第一印象就是「不就表格化而已,有什麼了不起?」、「幫我們整理格式轉換的介接器」...,但其實它不
Thumbnail
繼「【Google Colab Python系列】 資料處理神器 Pandas 起手式」之後,相信對於各位來說已經是小兒科了吧,沒關係! 我們今天來增加一點點小挑戰,你知道嗎? Pandas對於大部分人的第一印象就是「不就表格化而已,有什麼了不起?」、「幫我們整理格式轉換的介接器」...,但其實它不
Thumbnail
過往我們有介紹了「【Google Colab Python系列】 資料處理神器 Pandas 起手式」, 相信對於pandas的基本操作具有一定的基礎知識了, 主要著重在基本的操作, 讓我們快速篩選與分析資料, 但真實的世界是有可能具有很多類型的資料集分別儲存, 而不同的資料集又具有一些相似度, 需
Thumbnail
過往我們有介紹了「【Google Colab Python系列】 資料處理神器 Pandas 起手式」, 相信對於pandas的基本操作具有一定的基礎知識了, 主要著重在基本的操作, 讓我們快速篩選與分析資料, 但真實的世界是有可能具有很多類型的資料集分別儲存, 而不同的資料集又具有一些相似度, 需
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News