Ethan伊森
3
位追蹤者
追蹤
Ethan伊森
3
位追蹤者
我是一個不務正業的資料科學家,喜歡學習各種領域的新知識~希望可以藉由整理自己的學習筆記讓初學者也可以輕鬆上手,目前會以分享資料科學與人工智慧相關的內容為主。 另有AI專案接案與教學服務,可來信聊聊。 https://www.cake.me/ethan-462dc5
Ethan的AI學習筆記
6
會員
33
內容數
加入
前往沙龍
我是一個不務正業的資料科學家,從零開始學習的路途上跌跌撞撞,跌過許多坑,也撞過許多牆... 當有人迷失方向時,希望這些筆記可以成為你的指南針。
加入
前往沙龍
發佈內容
我的成就
全部內容
由新到舊
Ethan的AI學習筆記
2025/12/07
《從零開始的資料科學筆記》Day#22: 機器學習進階技巧四
📚 降維技術 降維是將高維數據轉換為低維表示的過程,同時保留數據的關鍵信息。這一技術對於現代機器學習至關重要,因為: 降低複雜度:減少特徵數量,簡化模型,加速訓練 消除冗餘:移除高度相關特徵,提高模型穩定性 減輕維度災難:在高維空間中,數據變得稀疏,距離度量失去意義 視覺化:將高維數據投
#
數據
#
程式
#
迴歸分析
1
留言
Ethan的AI學習筆記
2025/11/22
《從零開始的資料科學筆記》Day#21: 機器學習進階技巧三
🧲 特徵轉換方法 特徵轉換是調整數值型特徵分布形態的過程,幫助模型更有效地學習和提高預測性能。良好的特徵轉換可以: 改善數據分布:使偏斜分布更加對稱 降低異常值影響:減少極端值對模型的干擾 捕捉非線性關係:讓線性模型可以學習複雜模式 提高訓練穩定性:加速梯度下降收斂過程
#
迴歸分析
#
數據
#
程式
喜歡
留言
Ethan的AI學習筆記
2025/11/08
《從零開始的資料科學筆記》Day#20: 機器學習進階技巧二
🪛 特徵編碼 為什麼需要特徵編碼? 特徵編碼是將非數值型資料(如類別、文本等)轉換為數值形式的過程,這是機器學習模型處理資料的必要步驟,因為: 模型數值需求:大多數機器學習算法只接受數值輸入,無法直接處理文字或類別資料 語義保存:編碼過程必須保留原始類別的語義信息,不同編碼方式會保留不同的
#
迴歸分析
#
資料處理
#
數據
1
留言
Ethan的AI學習筆記
2025/10/24
《從零開始的資料科學筆記》Day#19: 機器學習進階技巧一
大家應該都實際練習過機器學習的四大技術了,包含迴歸分析、分類分析、分群分析以及時間序列分析。 在機器學習模型的開發過程中,我們常將焦點放在演算法的選擇與模型的訓練上,但實際上,一個高效且穩健的模型,往往取決於資料的前處理與特徵的設計。隨著模型複雜度提升,過擬合、特徵尺度不一致以及高維資料噪聲等問題會
#
機器學習
#
程式
#
資料處理
3
留言
Ethan的AI學習筆記
2025/10/11
《從零開始的資料科學筆記》Day#18: 資料具有時間特性怎麼訓練?
在現實生活中,許多資料並非靜止的,它們會隨著時間不斷變化,形成了一種特殊的資料型態,這就是時間序列資料。時間序列數據廣泛存在於各種領域,如金融市場的股票價格波動、氣候監測的溫度變化、製造業的機器故障檢測,以及網站流量的每日訪問量等。這些資料的最大特點在於:當前的觀測值與過去的值密切相關,未來的趨勢也
#
人工智慧
#
迴歸分析
#
機器學習
3
留言
Ethan的AI學習筆記
2025/10/04
《從零開始的資料科學筆記》Day#17: 沒有標籤如何分類?
在剛接觸機器學習時,會學習到模型是使用一組特徵X和標籤Y來訓練的,例如:使用房子的坪數、屋齡、地段等特徵可以預測這間房子的房價,這就是機器學習中迴歸分析的經典應用。但是在現實場景中,往往會出現數量龐大但是沒有明確標籤或類別的資料,這時應該怎麼利用這些資料,才能挖掘出潛藏在資料中的訊息?
#
資料處理
#
程式
#
機器學習
1
留言
Ethan的AI學習筆記
2025/09/23
《從零開始的資料科學筆記》Day#16: 疾病診斷
疾病診斷在醫學領域中是一項非常重要的任務,正確的診斷能夠有效幫助患者及早接受治療,改善預後,並避免不必要的風險。然而,疾病診斷通常需要依賴大量且複雜的數據分析,例如病患的檢測數值、影像和臨床數據等。面對如此大量的資料,人工診斷可能會因主觀判斷或疲勞而存在不確定性,這便為機器學習和人工智慧提供了一個巨
#
人工智慧
#
python
#
資料科學
1
留言
Ethan的AI學習筆記
2025/09/20
《從零開始的資料科學筆記》Day#15: 房價如何預測?
在學習完機器學習的各種基礎知識後,我們終於可以開始進入實際應用的階段。機器學習的常見應用大致可分為四大類:迴歸(Regression)、分類(Classification)、分群(Clustering)、以及時間序列分析(Time Series Analysis)。身為資料科學家,理解並掌握這些方法
#
程式
#
資料科學
#
python
1
留言
Ethan的AI學習筆記
2025/09/01
《從零開始的Python筆記》Day#8:Python魔法糖-裝飾器(下)
✍️ 常見裝飾器應用範例 計時器 計算函數運行的時間 運算時間對於機器學習模型來說非常重要,這會影響到模型訓練與部署推論的資源需求
#
基礎
#
程式
#
資料科學
3
留言
Ethan的AI學習筆記
2025/09/01
《從零開始的Python筆記》Day#8:Python魔法糖-裝飾器(上)
Python系列的筆記到這邊就差不多要告個段落,我介紹了基礎語法與進階語法的功能與使用方式。基礎語法對於初學者來說是滿容易理解而且能快速上手的部分,進階語法則是初學者的噩夢,常常讓人難以理解也不知道怎麼使用,不過它卻是讓大家提升程式設計能力的好工具。 一開始大家不需要去死記硬背這些進階語法,只需要大
#
基礎
#
學習
#
資料科學
4
留言
vocus 勳章
NFT
了解
如何蒐集勳章