《從零開始的資料科學筆記》
22
免費公開
房間資訊
這本筆記會收錄一系列成為資料科學家需要具備的基礎知識,包含NumPy、Pandas和Matplotlib等常用套件與機器學習概念。
全部
全部
全部類型
免費與付費
最新發佈
最新發佈
Ethan伊森
2025/11/22
《從零開始的資料科學筆記》Day#21: 機器學習進階技巧三
🧲 特徵轉換方法 特徵轉換是調整數值型特徵分布形態的過程,幫助模型更有效地學習和提高預測性能。良好的特徵轉換可以: 改善數據分布:使偏斜分布更加對稱 降低異常值影響:減少極端值對模型的干擾 捕捉非線性關係:讓線性模型可以學習複雜模式 提高訓練穩定性:加速梯度下降收斂過程
#
迴歸分析
#
數據
#
程式
Ethan伊森
2025/11/22
《從零開始的資料科學筆記》Day#21: 機器學習進階技巧三
🧲 特徵轉換方法 特徵轉換是調整數值型特徵分布形態的過程,幫助模型更有效地學習和提高預測性能。良好的特徵轉換可以: 改善數據分布:使偏斜分布更加對稱 降低異常值影響:減少極端值對模型的干擾 捕捉非線性關係:讓線性模型可以學習複雜模式 提高訓練穩定性:加速梯度下降收斂過程
#
迴歸分析
#
數據
#
程式
Ethan伊森
2025/11/08
《從零開始的資料科學筆記》Day#20: 機器學習進階技巧二
🪛 特徵編碼 為什麼需要特徵編碼? 特徵編碼是將非數值型資料(如類別、文本等)轉換為數值形式的過程,這是機器學習模型處理資料的必要步驟,因為: 模型數值需求:大多數機器學習算法只接受數值輸入,無法直接處理文字或類別資料 語義保存:編碼過程必須保留原始類別的語義信息,不同編碼方式會保留不同的
#
迴歸分析
#
資料處理
#
數據
1
Ethan伊森
2025/11/08
《從零開始的資料科學筆記》Day#20: 機器學習進階技巧二
🪛 特徵編碼 為什麼需要特徵編碼? 特徵編碼是將非數值型資料(如類別、文本等)轉換為數值形式的過程,這是機器學習模型處理資料的必要步驟,因為: 模型數值需求:大多數機器學習算法只接受數值輸入,無法直接處理文字或類別資料 語義保存:編碼過程必須保留原始類別的語義信息,不同編碼方式會保留不同的
#
迴歸分析
#
資料處理
#
數據
1
Ethan伊森
2025/10/24
《從零開始的資料科學筆記》Day#19: 機器學習進階技巧一
大家應該都實際練習過機器學習的四大技術了,包含迴歸分析、分類分析、分群分析以及時間序列分析。 在機器學習模型的開發過程中,我們常將焦點放在演算法的選擇與模型的訓練上,但實際上,一個高效且穩健的模型,往往取決於資料的前處理與特徵的設計。隨著模型複雜度提升,過擬合、特徵尺度不一致以及高維資料噪聲等問題會
#
機器學習
#
程式
#
資料處理
3
Ethan伊森
2025/10/24
《從零開始的資料科學筆記》Day#19: 機器學習進階技巧一
大家應該都實際練習過機器學習的四大技術了,包含迴歸分析、分類分析、分群分析以及時間序列分析。 在機器學習模型的開發過程中,我們常將焦點放在演算法的選擇與模型的訓練上,但實際上,一個高效且穩健的模型,往往取決於資料的前處理與特徵的設計。隨著模型複雜度提升,過擬合、特徵尺度不一致以及高維資料噪聲等問題會
#
機器學習
#
程式
#
資料處理
3
Ethan伊森
2025/10/11
《從零開始的資料科學筆記》Day#18: 資料具有時間特性怎麼訓練?
在現實生活中,許多資料並非靜止的,它們會隨著時間不斷變化,形成了一種特殊的資料型態,這就是時間序列資料。時間序列數據廣泛存在於各種領域,如金融市場的股票價格波動、氣候監測的溫度變化、製造業的機器故障檢測,以及網站流量的每日訪問量等。這些資料的最大特點在於:當前的觀測值與過去的值密切相關,未來的趨勢也
#
人工智慧
#
迴歸分析
#
機器學習
3
Ethan伊森
2025/10/11
《從零開始的資料科學筆記》Day#18: 資料具有時間特性怎麼訓練?
在現實生活中,許多資料並非靜止的,它們會隨著時間不斷變化,形成了一種特殊的資料型態,這就是時間序列資料。時間序列數據廣泛存在於各種領域,如金融市場的股票價格波動、氣候監測的溫度變化、製造業的機器故障檢測,以及網站流量的每日訪問量等。這些資料的最大特點在於:當前的觀測值與過去的值密切相關,未來的趨勢也
#
人工智慧
#
迴歸分析
#
機器學習
3
Ethan伊森
2025/10/04
《從零開始的資料科學筆記》Day#17: 沒有標籤如何分類?
在剛接觸機器學習時,會學習到模型是使用一組特徵X和標籤Y來訓練的,例如:使用房子的坪數、屋齡、地段等特徵可以預測這間房子的房價,這就是機器學習中迴歸分析的經典應用。但是在現實場景中,往往會出現數量龐大但是沒有明確標籤或類別的資料,這時應該怎麼利用這些資料,才能挖掘出潛藏在資料中的訊息?
#
資料處理
#
程式
#
機器學習
1
Ethan伊森
2025/10/04
《從零開始的資料科學筆記》Day#17: 沒有標籤如何分類?
在剛接觸機器學習時,會學習到模型是使用一組特徵X和標籤Y來訓練的,例如:使用房子的坪數、屋齡、地段等特徵可以預測這間房子的房價,這就是機器學習中迴歸分析的經典應用。但是在現實場景中,往往會出現數量龐大但是沒有明確標籤或類別的資料,這時應該怎麼利用這些資料,才能挖掘出潛藏在資料中的訊息?
#
資料處理
#
程式
#
機器學習
1
Ethan伊森
2025/09/23
《從零開始的資料科學筆記》Day#16: 疾病診斷
疾病診斷在醫學領域中是一項非常重要的任務,正確的診斷能夠有效幫助患者及早接受治療,改善預後,並避免不必要的風險。然而,疾病診斷通常需要依賴大量且複雜的數據分析,例如病患的檢測數值、影像和臨床數據等。面對如此大量的資料,人工診斷可能會因主觀判斷或疲勞而存在不確定性,這便為機器學習和人工智慧提供了一個巨
#
人工智慧
#
python
#
資料科學
1
Ethan伊森
2025/09/23
《從零開始的資料科學筆記》Day#16: 疾病診斷
疾病診斷在醫學領域中是一項非常重要的任務,正確的診斷能夠有效幫助患者及早接受治療,改善預後,並避免不必要的風險。然而,疾病診斷通常需要依賴大量且複雜的數據分析,例如病患的檢測數值、影像和臨床數據等。面對如此大量的資料,人工診斷可能會因主觀判斷或疲勞而存在不確定性,這便為機器學習和人工智慧提供了一個巨
#
人工智慧
#
python
#
資料科學
1
Ethan伊森
2025/09/20
《從零開始的資料科學筆記》Day#15: 房價如何預測?
在學習完機器學習的各種基礎知識後,我們終於可以開始進入實際應用的階段。機器學習的常見應用大致可分為四大類:迴歸(Regression)、分類(Classification)、分群(Clustering)、以及時間序列分析(Time Series Analysis)。身為資料科學家,理解並掌握這些方法
#
程式
#
資料科學
#
python
1
Ethan伊森
2025/09/20
《從零開始的資料科學筆記》Day#15: 房價如何預測?
在學習完機器學習的各種基礎知識後,我們終於可以開始進入實際應用的階段。機器學習的常見應用大致可分為四大類:迴歸(Regression)、分類(Classification)、分群(Clustering)、以及時間序列分析(Time Series Analysis)。身為資料科學家,理解並掌握這些方法
#
程式
#
資料科學
#
python
1
Ethan伊森
2025/07/25
《從零開始的資料科學筆記》Day#14:機器學習流程-下
帶著大家簡單地看過整個機器學習流程之後,相信每個人對於機器學習在幹嘛還是很模糊,因此這章節來個實際範例,讓大家更了解在每一個流程中資料科學家究竟都在做什麼。 這裡我使用機器學習中很有名的”鳶尾花”資料集,這部分內容會比較多,希望大家可以跟著我的步驟慢慢地操作,細細地去體驗如何完成一個基本的機器學習
Ethan伊森
2025/07/25
《從零開始的資料科學筆記》Day#14:機器學習流程-下
帶著大家簡單地看過整個機器學習流程之後,相信每個人對於機器學習在幹嘛還是很模糊,因此這章節來個實際範例,讓大家更了解在每一個流程中資料科學家究竟都在做什麼。 這裡我使用機器學習中很有名的”鳶尾花”資料集,這部分內容會比較多,希望大家可以跟著我的步驟慢慢地操作,細細地去體驗如何完成一個基本的機器學習
Ethan伊森
2025/07/19
《從零開始的資料科學筆記》Day#13:機器學習流程-中
在這個章節會繼續介紹機器學習後半部的流程,主要也是概念式的說明,每一個小細節在後續的文章中會再單獨拿出來說明。請大家盡量記得文章中每個流程所提到的專有名詞,大概了解每一個步驟在做什麼對於後續的學習很有幫助!
#
模型
#
機器學習
#
測試
Ethan伊森
2025/07/19
《從零開始的資料科學筆記》Day#13:機器學習流程-中
在這個章節會繼續介紹機器學習後半部的流程,主要也是概念式的說明,每一個小細節在後續的文章中會再單獨拿出來說明。請大家盡量記得文章中每個流程所提到的專有名詞,大概了解每一個步驟在做什麼對於後續的學習很有幫助!
#
模型
#
機器學習
#
測試
Ethan伊森
2025/07/16
《從零開始的資料科學筆記》Day#12:機器學習流程-上
接著會詳細的介紹機器學習的每一個步驟在做什麼,這部分專有名詞會比較多,希望大家可以盡量熟悉。 🙋問題定義 在真正進入機器學習流程之前,需要先定義你想要解決的問題。 如何將你的問題、你的痛點,轉換成機器學習可以執行的任務是你們會遇到的第一個難題,原則上可以遵循以下方法來思考:
#
人工智慧
#
學習
#
資料處理
Ethan伊森
2025/07/16
《從零開始的資料科學筆記》Day#12:機器學習流程-上
接著會詳細的介紹機器學習的每一個步驟在做什麼,這部分專有名詞會比較多,希望大家可以盡量熟悉。 🙋問題定義 在真正進入機器學習流程之前,需要先定義你想要解決的問題。 如何將你的問題、你的痛點,轉換成機器學習可以執行的任務是你們會遇到的第一個難題,原則上可以遵循以下方法來思考:
#
人工智慧
#
學習
#
資料處理
Ethan伊森
2025/07/05
《從零開始的資料科學筆記》Day#11:機器學習概述
🔍 為什麼要學機器學習? 在這個資料驅動的時代,從圖像辨識、語音助手到金融風險預測,都離不開機器學習。 透過「從資料中自動學習規則」的能力,機器學習幫助我們: 自動化決策流程(例如:信貸核准) 從龐大資料中發現趨勢與模式(例如:顧客行為分析) 增強傳統演算法的適應力與預測能力
#
程式
#
資料科學
#
人工智慧
2
Ethan伊森
2025/07/05
《從零開始的資料科學筆記》Day#11:機器學習概述
🔍 為什麼要學機器學習? 在這個資料驅動的時代,從圖像辨識、語音助手到金融風險預測,都離不開機器學習。 透過「從資料中自動學習規則」的能力,機器學習幫助我們: 自動化決策流程(例如:信貸核准) 從龐大資料中發現趨勢與模式(例如:顧客行為分析) 增強傳統演算法的適應力與預測能力
#
程式
#
資料科學
#
人工智慧
2
Ethan伊森
2025/06/27
《從零開始的資料科學筆記》Day#10:模型挑選、訓練與推論
在輔導學員的時候遇過很多初學者會搞不清楚到底模型是什麼?訓練又是怎麼一回事? 因此這篇文章主要是提供初學者一些簡單的概念,知道”模型”和”訓練”是在做什麼,不涉及程式碼撰寫與執行。 希望藉由簡單的說明讓大家可以先了解這些基本概念,可以加快後續實際操作上手的時間。
#
程式
#
資料科學
#
人工智慧
Ethan伊森
2025/06/27
《從零開始的資料科學筆記》Day#10:模型挑選、訓練與推論
在輔導學員的時候遇過很多初學者會搞不清楚到底模型是什麼?訓練又是怎麼一回事? 因此這篇文章主要是提供初學者一些簡單的概念,知道”模型”和”訓練”是在做什麼,不涉及程式碼撰寫與執行。 希望藉由簡單的說明讓大家可以先了解這些基本概念,可以加快後續實際操作上手的時間。
#
程式
#
資料科學
#
人工智慧
Ethan伊森
2025/06/23
《從零開始的資料科學筆記》Day#9: 特徵工程
🙋♀️ 什麼是特徵(Feature)? 想像一個情境: 你想領養一隻小狗,到了收容所後,該怎麼跟承辦人員描述你想要的狗狗呢? 你可能會說:「我想要一隻可愛的小狗。」 但這樣的描述太模糊了,對方可能無法立刻理解你的偏好。
#
人工智慧
#
程式
#
資料科學
1
Ethan伊森
2025/06/23
《從零開始的資料科學筆記》Day#9: 特徵工程
🙋♀️ 什麼是特徵(Feature)? 想像一個情境: 你想領養一隻小狗,到了收容所後,該怎麼跟承辦人員描述你想要的狗狗呢? 你可能會說:「我想要一隻可愛的小狗。」 但這樣的描述太模糊了,對方可能無法立刻理解你的偏好。
#
人工智慧
#
程式
#
資料科學
1
Ethan伊森
2025/06/18
《從零開始的資料科學筆記》Day#8:資料前處理入門
好不容易學習完資料科學三大基礎套件(NumPy / Pandas / Matplotlib)之後,就可以開始學習什麼是資料前處理(Data Preprocessing)、為什麼要做?、以及怎麼做?
#
人工智慧
#
程式
#
資料科學
1
Ethan伊森
2025/06/18
《從零開始的資料科學筆記》Day#8:資料前處理入門
好不容易學習完資料科學三大基礎套件(NumPy / Pandas / Matplotlib)之後,就可以開始學習什麼是資料前處理(Data Preprocessing)、為什麼要做?、以及怎麼做?
#
人工智慧
#
程式
#
資料科學
1
Ethan伊森
2025/06/17
《從零開始的資料科學筆記》Day#7:None 與 NaN 的差異
Python/Pandas中的None VS NaN 大家在進行資料清理時一定會遇到一個問題,到底缺失值、空值要怎麼判斷,以及如何處理? 而且時常會被他們的定義搞得頭昏腦脹…
#
人工智慧
#
程式
#
資料科學
2
Ethan伊森
2025/06/17
《從零開始的資料科學筆記》Day#7:None 與 NaN 的差異
Python/Pandas中的None VS NaN 大家在進行資料清理時一定會遇到一個問題,到底缺失值、空值要怎麼判斷,以及如何處理? 而且時常會被他們的定義搞得頭昏腦脹…
#
人工智慧
#
程式
#
資料科學
2
Ethan伊森
2025/06/16
《從零開始的資料科學筆記》Day#6: Matplotlib視覺化
🔍什麼是Matplotlib? Matplotlib 是 Python 最早也是最強大的 2D 資料視覺化套件,提供靈活且客製化程度高的繪圖介面。 🌍 發展歷史悠久,幾乎所有可視化工具都以它為基礎(如 Seaborn、Pandas 內建繪圖、Plotly)
#
人工智慧
#
程式
#
資料科學
2
Ethan伊森
2025/06/16
《從零開始的資料科學筆記》Day#6: Matplotlib視覺化
🔍什麼是Matplotlib? Matplotlib 是 Python 最早也是最強大的 2D 資料視覺化套件,提供靈活且客製化程度高的繪圖介面。 🌍 發展歷史悠久,幾乎所有可視化工具都以它為基礎(如 Seaborn、Pandas 內建繪圖、Plotly)
#
人工智慧
#
程式
#
資料科學
2
Ethan伊森
2025/06/14
《從零開始的資料科學筆記》Day#5:深入Pandas
🧪GroupBy能做什麼? groupby() 可將資料依照欄位分組,接著對每個群體套用統計或轉換函式,如同 SQL 中的 GROUP BY。 善用groupby()可以讓自己資料處理能力更上一層!!!
#
程式
#
資料科學
#
人工智慧
Ethan伊森
2025/06/14
《從零開始的資料科學筆記》Day#5:深入Pandas
🧪GroupBy能做什麼? groupby() 可將資料依照欄位分組,接著對每個群體套用統計或轉換函式,如同 SQL 中的 GROUP BY。 善用groupby()可以讓自己資料處理能力更上一層!!!
#
程式
#
資料科學
#
人工智慧
Ethan伊森
2025/06/10
《從零開始的資料科學筆記》Day#4:Pandas進階
深入掌握Pandas技巧
#
程式
#
資料科學
#
人工智慧
Ethan伊森
2025/06/10
《從零開始的資料科學筆記》Day#4:Pandas進階
深入掌握Pandas技巧
#
程式
#
資料科學
#
人工智慧
Ethan伊森
2025/06/09
《從零開始的資料科學筆記》Day#3: Pandas入門
🐼什麼是Pandas? Pandas 是 Python 最重要的資料處理與分析工具,名稱來自 "Panel Data"(跨時間的結構化資料),由 Wes McKinney 開發。 它提供兩個核心資料結構: Series:一維的資料列(類似 list) DataFrame:二維表格資料結構
#
程式
#
資料科學
#
人工智慧
Ethan伊森
2025/06/09
《從零開始的資料科學筆記》Day#3: Pandas入門
🐼什麼是Pandas? Pandas 是 Python 最重要的資料處理與分析工具,名稱來自 "Panel Data"(跨時間的結構化資料),由 Wes McKinney 開發。 它提供兩個核心資料結構: Series:一維的資料列(類似 list) DataFrame:二維表格資料結構
#
程式
#
資料科學
#
人工智慧
Ethan伊森
2025/06/07
《從零開始的資料科學筆記》Day#2: NumPy進階
再見NumPy 在學習完上一篇NumPy入門教學後,可以接著熟悉一下NumPy進階,這部分包含了許多資料前處理上常用的技巧和語法。 其實有更多的語法我沒有列出來,因為不只你們記不住,我也記不得! 這邊整理的都是比較常用的部分,其他函數等你們有用到的時候自然會知道~
#
程式
#
資料科學
#
學習
1
Ethan伊森
2025/06/07
《從零開始的資料科學筆記》Day#2: NumPy進階
再見NumPy 在學習完上一篇NumPy入門教學後,可以接著熟悉一下NumPy進階,這部分包含了許多資料前處理上常用的技巧和語法。 其實有更多的語法我沒有列出來,因為不只你們記不住,我也記不得! 這邊整理的都是比較常用的部分,其他函數等你們有用到的時候自然會知道~
#
程式
#
資料科學
#
學習
1
加入
全部
全部
全部類型
免費與付費
最新發佈
最新發佈
Ethan伊森
2025/11/22
《從零開始的資料科學筆記》Day#21: 機器學習進階技巧三
🧲 特徵轉換方法 特徵轉換是調整數值型特徵分布形態的過程,幫助模型更有效地學習和提高預測性能。良好的特徵轉換可以: 改善數據分布:使偏斜分布更加對稱 降低異常值影響:減少極端值對模型的干擾 捕捉非線性關係:讓線性模型可以學習複雜模式 提高訓練穩定性:加速梯度下降收斂過程
#
迴歸分析
#
數據
#
程式
Ethan伊森
2025/11/22
《從零開始的資料科學筆記》Day#21: 機器學習進階技巧三
🧲 特徵轉換方法 特徵轉換是調整數值型特徵分布形態的過程,幫助模型更有效地學習和提高預測性能。良好的特徵轉換可以: 改善數據分布:使偏斜分布更加對稱 降低異常值影響:減少極端值對模型的干擾 捕捉非線性關係:讓線性模型可以學習複雜模式 提高訓練穩定性:加速梯度下降收斂過程
#
迴歸分析
#
數據
#
程式
Ethan伊森
2025/11/08
《從零開始的資料科學筆記》Day#20: 機器學習進階技巧二
🪛 特徵編碼 為什麼需要特徵編碼? 特徵編碼是將非數值型資料(如類別、文本等)轉換為數值形式的過程,這是機器學習模型處理資料的必要步驟,因為: 模型數值需求:大多數機器學習算法只接受數值輸入,無法直接處理文字或類別資料 語義保存:編碼過程必須保留原始類別的語義信息,不同編碼方式會保留不同的
#
迴歸分析
#
資料處理
#
數據
1
Ethan伊森
2025/11/08
《從零開始的資料科學筆記》Day#20: 機器學習進階技巧二
🪛 特徵編碼 為什麼需要特徵編碼? 特徵編碼是將非數值型資料(如類別、文本等)轉換為數值形式的過程,這是機器學習模型處理資料的必要步驟,因為: 模型數值需求:大多數機器學習算法只接受數值輸入,無法直接處理文字或類別資料 語義保存:編碼過程必須保留原始類別的語義信息,不同編碼方式會保留不同的
#
迴歸分析
#
資料處理
#
數據
1
Ethan伊森
2025/10/24
《從零開始的資料科學筆記》Day#19: 機器學習進階技巧一
大家應該都實際練習過機器學習的四大技術了,包含迴歸分析、分類分析、分群分析以及時間序列分析。 在機器學習模型的開發過程中,我們常將焦點放在演算法的選擇與模型的訓練上,但實際上,一個高效且穩健的模型,往往取決於資料的前處理與特徵的設計。隨著模型複雜度提升,過擬合、特徵尺度不一致以及高維資料噪聲等問題會
#
機器學習
#
程式
#
資料處理
3
Ethan伊森
2025/10/24
《從零開始的資料科學筆記》Day#19: 機器學習進階技巧一
大家應該都實際練習過機器學習的四大技術了,包含迴歸分析、分類分析、分群分析以及時間序列分析。 在機器學習模型的開發過程中,我們常將焦點放在演算法的選擇與模型的訓練上,但實際上,一個高效且穩健的模型,往往取決於資料的前處理與特徵的設計。隨著模型複雜度提升,過擬合、特徵尺度不一致以及高維資料噪聲等問題會
#
機器學習
#
程式
#
資料處理
3
Ethan伊森
2025/10/11
《從零開始的資料科學筆記》Day#18: 資料具有時間特性怎麼訓練?
在現實生活中,許多資料並非靜止的,它們會隨著時間不斷變化,形成了一種特殊的資料型態,這就是時間序列資料。時間序列數據廣泛存在於各種領域,如金融市場的股票價格波動、氣候監測的溫度變化、製造業的機器故障檢測,以及網站流量的每日訪問量等。這些資料的最大特點在於:當前的觀測值與過去的值密切相關,未來的趨勢也
#
人工智慧
#
迴歸分析
#
機器學習
3
Ethan伊森
2025/10/11
《從零開始的資料科學筆記》Day#18: 資料具有時間特性怎麼訓練?
在現實生活中,許多資料並非靜止的,它們會隨著時間不斷變化,形成了一種特殊的資料型態,這就是時間序列資料。時間序列數據廣泛存在於各種領域,如金融市場的股票價格波動、氣候監測的溫度變化、製造業的機器故障檢測,以及網站流量的每日訪問量等。這些資料的最大特點在於:當前的觀測值與過去的值密切相關,未來的趨勢也
#
人工智慧
#
迴歸分析
#
機器學習
3
Ethan伊森
2025/10/04
《從零開始的資料科學筆記》Day#17: 沒有標籤如何分類?
在剛接觸機器學習時,會學習到模型是使用一組特徵X和標籤Y來訓練的,例如:使用房子的坪數、屋齡、地段等特徵可以預測這間房子的房價,這就是機器學習中迴歸分析的經典應用。但是在現實場景中,往往會出現數量龐大但是沒有明確標籤或類別的資料,這時應該怎麼利用這些資料,才能挖掘出潛藏在資料中的訊息?
#
資料處理
#
程式
#
機器學習
1
Ethan伊森
2025/10/04
《從零開始的資料科學筆記》Day#17: 沒有標籤如何分類?
在剛接觸機器學習時,會學習到模型是使用一組特徵X和標籤Y來訓練的,例如:使用房子的坪數、屋齡、地段等特徵可以預測這間房子的房價,這就是機器學習中迴歸分析的經典應用。但是在現實場景中,往往會出現數量龐大但是沒有明確標籤或類別的資料,這時應該怎麼利用這些資料,才能挖掘出潛藏在資料中的訊息?
#
資料處理
#
程式
#
機器學習
1
Ethan伊森
2025/09/23
《從零開始的資料科學筆記》Day#16: 疾病診斷
疾病診斷在醫學領域中是一項非常重要的任務,正確的診斷能夠有效幫助患者及早接受治療,改善預後,並避免不必要的風險。然而,疾病診斷通常需要依賴大量且複雜的數據分析,例如病患的檢測數值、影像和臨床數據等。面對如此大量的資料,人工診斷可能會因主觀判斷或疲勞而存在不確定性,這便為機器學習和人工智慧提供了一個巨
#
人工智慧
#
python
#
資料科學
1
Ethan伊森
2025/09/23
《從零開始的資料科學筆記》Day#16: 疾病診斷
疾病診斷在醫學領域中是一項非常重要的任務,正確的診斷能夠有效幫助患者及早接受治療,改善預後,並避免不必要的風險。然而,疾病診斷通常需要依賴大量且複雜的數據分析,例如病患的檢測數值、影像和臨床數據等。面對如此大量的資料,人工診斷可能會因主觀判斷或疲勞而存在不確定性,這便為機器學習和人工智慧提供了一個巨
#
人工智慧
#
python
#
資料科學
1
Ethan伊森
2025/09/20
《從零開始的資料科學筆記》Day#15: 房價如何預測?
在學習完機器學習的各種基礎知識後,我們終於可以開始進入實際應用的階段。機器學習的常見應用大致可分為四大類:迴歸(Regression)、分類(Classification)、分群(Clustering)、以及時間序列分析(Time Series Analysis)。身為資料科學家,理解並掌握這些方法
#
程式
#
資料科學
#
python
1
Ethan伊森
2025/09/20
《從零開始的資料科學筆記》Day#15: 房價如何預測?
在學習完機器學習的各種基礎知識後,我們終於可以開始進入實際應用的階段。機器學習的常見應用大致可分為四大類:迴歸(Regression)、分類(Classification)、分群(Clustering)、以及時間序列分析(Time Series Analysis)。身為資料科學家,理解並掌握這些方法
#
程式
#
資料科學
#
python
1
Ethan伊森
2025/07/25
《從零開始的資料科學筆記》Day#14:機器學習流程-下
帶著大家簡單地看過整個機器學習流程之後,相信每個人對於機器學習在幹嘛還是很模糊,因此這章節來個實際範例,讓大家更了解在每一個流程中資料科學家究竟都在做什麼。 這裡我使用機器學習中很有名的”鳶尾花”資料集,這部分內容會比較多,希望大家可以跟著我的步驟慢慢地操作,細細地去體驗如何完成一個基本的機器學習
Ethan伊森
2025/07/25
《從零開始的資料科學筆記》Day#14:機器學習流程-下
帶著大家簡單地看過整個機器學習流程之後,相信每個人對於機器學習在幹嘛還是很模糊,因此這章節來個實際範例,讓大家更了解在每一個流程中資料科學家究竟都在做什麼。 這裡我使用機器學習中很有名的”鳶尾花”資料集,這部分內容會比較多,希望大家可以跟著我的步驟慢慢地操作,細細地去體驗如何完成一個基本的機器學習
Ethan伊森
2025/07/19
《從零開始的資料科學筆記》Day#13:機器學習流程-中
在這個章節會繼續介紹機器學習後半部的流程,主要也是概念式的說明,每一個小細節在後續的文章中會再單獨拿出來說明。請大家盡量記得文章中每個流程所提到的專有名詞,大概了解每一個步驟在做什麼對於後續的學習很有幫助!
#
模型
#
機器學習
#
測試
Ethan伊森
2025/07/19
《從零開始的資料科學筆記》Day#13:機器學習流程-中
在這個章節會繼續介紹機器學習後半部的流程,主要也是概念式的說明,每一個小細節在後續的文章中會再單獨拿出來說明。請大家盡量記得文章中每個流程所提到的專有名詞,大概了解每一個步驟在做什麼對於後續的學習很有幫助!
#
模型
#
機器學習
#
測試
Ethan伊森
2025/07/16
《從零開始的資料科學筆記》Day#12:機器學習流程-上
接著會詳細的介紹機器學習的每一個步驟在做什麼,這部分專有名詞會比較多,希望大家可以盡量熟悉。 🙋問題定義 在真正進入機器學習流程之前,需要先定義你想要解決的問題。 如何將你的問題、你的痛點,轉換成機器學習可以執行的任務是你們會遇到的第一個難題,原則上可以遵循以下方法來思考:
#
人工智慧
#
學習
#
資料處理
Ethan伊森
2025/07/16
《從零開始的資料科學筆記》Day#12:機器學習流程-上
接著會詳細的介紹機器學習的每一個步驟在做什麼,這部分專有名詞會比較多,希望大家可以盡量熟悉。 🙋問題定義 在真正進入機器學習流程之前,需要先定義你想要解決的問題。 如何將你的問題、你的痛點,轉換成機器學習可以執行的任務是你們會遇到的第一個難題,原則上可以遵循以下方法來思考:
#
人工智慧
#
學習
#
資料處理
Ethan伊森
2025/07/05
《從零開始的資料科學筆記》Day#11:機器學習概述
🔍 為什麼要學機器學習? 在這個資料驅動的時代,從圖像辨識、語音助手到金融風險預測,都離不開機器學習。 透過「從資料中自動學習規則」的能力,機器學習幫助我們: 自動化決策流程(例如:信貸核准) 從龐大資料中發現趨勢與模式(例如:顧客行為分析) 增強傳統演算法的適應力與預測能力
#
程式
#
資料科學
#
人工智慧
2
Ethan伊森
2025/07/05
《從零開始的資料科學筆記》Day#11:機器學習概述
🔍 為什麼要學機器學習? 在這個資料驅動的時代,從圖像辨識、語音助手到金融風險預測,都離不開機器學習。 透過「從資料中自動學習規則」的能力,機器學習幫助我們: 自動化決策流程(例如:信貸核准) 從龐大資料中發現趨勢與模式(例如:顧客行為分析) 增強傳統演算法的適應力與預測能力
#
程式
#
資料科學
#
人工智慧
2
Ethan伊森
2025/06/27
《從零開始的資料科學筆記》Day#10:模型挑選、訓練與推論
在輔導學員的時候遇過很多初學者會搞不清楚到底模型是什麼?訓練又是怎麼一回事? 因此這篇文章主要是提供初學者一些簡單的概念,知道”模型”和”訓練”是在做什麼,不涉及程式碼撰寫與執行。 希望藉由簡單的說明讓大家可以先了解這些基本概念,可以加快後續實際操作上手的時間。
#
程式
#
資料科學
#
人工智慧
Ethan伊森
2025/06/27
《從零開始的資料科學筆記》Day#10:模型挑選、訓練與推論
在輔導學員的時候遇過很多初學者會搞不清楚到底模型是什麼?訓練又是怎麼一回事? 因此這篇文章主要是提供初學者一些簡單的概念,知道”模型”和”訓練”是在做什麼,不涉及程式碼撰寫與執行。 希望藉由簡單的說明讓大家可以先了解這些基本概念,可以加快後續實際操作上手的時間。
#
程式
#
資料科學
#
人工智慧
Ethan伊森
2025/06/23
《從零開始的資料科學筆記》Day#9: 特徵工程
🙋♀️ 什麼是特徵(Feature)? 想像一個情境: 你想領養一隻小狗,到了收容所後,該怎麼跟承辦人員描述你想要的狗狗呢? 你可能會說:「我想要一隻可愛的小狗。」 但這樣的描述太模糊了,對方可能無法立刻理解你的偏好。
#
人工智慧
#
程式
#
資料科學
1
Ethan伊森
2025/06/23
《從零開始的資料科學筆記》Day#9: 特徵工程
🙋♀️ 什麼是特徵(Feature)? 想像一個情境: 你想領養一隻小狗,到了收容所後,該怎麼跟承辦人員描述你想要的狗狗呢? 你可能會說:「我想要一隻可愛的小狗。」 但這樣的描述太模糊了,對方可能無法立刻理解你的偏好。
#
人工智慧
#
程式
#
資料科學
1
Ethan伊森
2025/06/18
《從零開始的資料科學筆記》Day#8:資料前處理入門
好不容易學習完資料科學三大基礎套件(NumPy / Pandas / Matplotlib)之後,就可以開始學習什麼是資料前處理(Data Preprocessing)、為什麼要做?、以及怎麼做?
#
人工智慧
#
程式
#
資料科學
1
Ethan伊森
2025/06/18
《從零開始的資料科學筆記》Day#8:資料前處理入門
好不容易學習完資料科學三大基礎套件(NumPy / Pandas / Matplotlib)之後,就可以開始學習什麼是資料前處理(Data Preprocessing)、為什麼要做?、以及怎麼做?
#
人工智慧
#
程式
#
資料科學
1
Ethan伊森
2025/06/17
《從零開始的資料科學筆記》Day#7:None 與 NaN 的差異
Python/Pandas中的None VS NaN 大家在進行資料清理時一定會遇到一個問題,到底缺失值、空值要怎麼判斷,以及如何處理? 而且時常會被他們的定義搞得頭昏腦脹…
#
人工智慧
#
程式
#
資料科學
2
Ethan伊森
2025/06/17
《從零開始的資料科學筆記》Day#7:None 與 NaN 的差異
Python/Pandas中的None VS NaN 大家在進行資料清理時一定會遇到一個問題,到底缺失值、空值要怎麼判斷,以及如何處理? 而且時常會被他們的定義搞得頭昏腦脹…
#
人工智慧
#
程式
#
資料科學
2
Ethan伊森
2025/06/16
《從零開始的資料科學筆記》Day#6: Matplotlib視覺化
🔍什麼是Matplotlib? Matplotlib 是 Python 最早也是最強大的 2D 資料視覺化套件,提供靈活且客製化程度高的繪圖介面。 🌍 發展歷史悠久,幾乎所有可視化工具都以它為基礎(如 Seaborn、Pandas 內建繪圖、Plotly)
#
人工智慧
#
程式
#
資料科學
2
Ethan伊森
2025/06/16
《從零開始的資料科學筆記》Day#6: Matplotlib視覺化
🔍什麼是Matplotlib? Matplotlib 是 Python 最早也是最強大的 2D 資料視覺化套件,提供靈活且客製化程度高的繪圖介面。 🌍 發展歷史悠久,幾乎所有可視化工具都以它為基礎(如 Seaborn、Pandas 內建繪圖、Plotly)
#
人工智慧
#
程式
#
資料科學
2
Ethan伊森
2025/06/14
《從零開始的資料科學筆記》Day#5:深入Pandas
🧪GroupBy能做什麼? groupby() 可將資料依照欄位分組,接著對每個群體套用統計或轉換函式,如同 SQL 中的 GROUP BY。 善用groupby()可以讓自己資料處理能力更上一層!!!
#
程式
#
資料科學
#
人工智慧
Ethan伊森
2025/06/14
《從零開始的資料科學筆記》Day#5:深入Pandas
🧪GroupBy能做什麼? groupby() 可將資料依照欄位分組,接著對每個群體套用統計或轉換函式,如同 SQL 中的 GROUP BY。 善用groupby()可以讓自己資料處理能力更上一層!!!
#
程式
#
資料科學
#
人工智慧
Ethan伊森
2025/06/10
《從零開始的資料科學筆記》Day#4:Pandas進階
深入掌握Pandas技巧
#
程式
#
資料科學
#
人工智慧
Ethan伊森
2025/06/10
《從零開始的資料科學筆記》Day#4:Pandas進階
深入掌握Pandas技巧
#
程式
#
資料科學
#
人工智慧
Ethan伊森
2025/06/09
《從零開始的資料科學筆記》Day#3: Pandas入門
🐼什麼是Pandas? Pandas 是 Python 最重要的資料處理與分析工具,名稱來自 "Panel Data"(跨時間的結構化資料),由 Wes McKinney 開發。 它提供兩個核心資料結構: Series:一維的資料列(類似 list) DataFrame:二維表格資料結構
#
程式
#
資料科學
#
人工智慧
Ethan伊森
2025/06/09
《從零開始的資料科學筆記》Day#3: Pandas入門
🐼什麼是Pandas? Pandas 是 Python 最重要的資料處理與分析工具,名稱來自 "Panel Data"(跨時間的結構化資料),由 Wes McKinney 開發。 它提供兩個核心資料結構: Series:一維的資料列(類似 list) DataFrame:二維表格資料結構
#
程式
#
資料科學
#
人工智慧
Ethan伊森
2025/06/07
《從零開始的資料科學筆記》Day#2: NumPy進階
再見NumPy 在學習完上一篇NumPy入門教學後,可以接著熟悉一下NumPy進階,這部分包含了許多資料前處理上常用的技巧和語法。 其實有更多的語法我沒有列出來,因為不只你們記不住,我也記不得! 這邊整理的都是比較常用的部分,其他函數等你們有用到的時候自然會知道~
#
程式
#
資料科學
#
學習
1
Ethan伊森
2025/06/07
《從零開始的資料科學筆記》Day#2: NumPy進階
再見NumPy 在學習完上一篇NumPy入門教學後,可以接著熟悉一下NumPy進階,這部分包含了許多資料前處理上常用的技巧和語法。 其實有更多的語法我沒有列出來,因為不只你們記不住,我也記不得! 這邊整理的都是比較常用的部分,其他函數等你們有用到的時候自然會知道~
#
程式
#
資料科學
#
學習
1