Ethan的AI學習筆記
8
會員
33
內容
加入
首頁
內容
關於
加入
Ethan的AI學習筆記
8
會員
33
內容
加入
Top 5
1
《從零開始的資料科學筆記》Day#7:None 與 NaN 的差異
2
《從零開始的資料科學筆記》Day#1: NumPy入門
3
《從零開始的資料科學筆記》Day#18: 資料具有時間特性怎麼訓練?
4
《從零開始的資料科學筆記》Day#10:模型挑選、訓練與推論
5
《從零開始的資料科學筆記》Day#19: 機器學習進階技巧一
1
《從零開始的資料科學筆記》Day#7:None 與 NaN 的差異
2
《從零開始的資料科學筆記》Day#1: NumPy入門
3
《從零開始的資料科學筆記》Day#18: 資料具有時間特性怎麼訓練?
4
《從零開始的資料科學筆記》Day#10:模型挑選、訓練與推論
5
《從零開始的資料科學筆記》Day#19: 機器學習進階技巧一
《從零開始的資料科學筆記》
《從零開始的資料科學筆記》Day#22: 機器學習進階技巧四
📚 降維技術 降維是將高維數據轉換為低維表示的過程,同時保留數據的關鍵信息。這一技術對於現代機器學習至關重要,因為: 降低複雜度:減少特徵數量,簡化模型,加速訓練 消除冗餘:移除高度相關特徵,提高模型穩定性 減輕維度災難:在高維空間中,數據變得稀疏,距離度量失去意義 視覺化:將高維數據投
2025/12/07
3
《從零開始的資料科學筆記》Day#21: 機器學習進階技巧三
🧲 特徵轉換方法 特徵轉換是調整數值型特徵分布形態的過程,幫助模型更有效地學習和提高預測性能。良好的特徵轉換可以: 改善數據分布:使偏斜分布更加對稱 降低異常值影響:減少極端值對模型的干擾 捕捉非線性關係:讓線性模型可以學習複雜模式 提高訓練穩定性:加速梯度下降收斂過程
2025/11/22
《從零開始的資料科學筆記》Day#20: 機器學習進階技巧二
🪛 特徵編碼 為什麼需要特徵編碼? 特徵編碼是將非數值型資料(如類別、文本等)轉換為數值形式的過程,這是機器學習模型處理資料的必要步驟,因為: 模型數值需求:大多數機器學習算法只接受數值輸入,無法直接處理文字或類別資料 語義保存:編碼過程必須保留原始類別的語義信息,不同編碼方式會保留不同的
2025/11/08
1
《從零開始的資料科學筆記》Day#19: 機器學習進階技巧一
大家應該都實際練習過機器學習的四大技術了,包含迴歸分析、分類分析、分群分析以及時間序列分析。 在機器學習模型的開發過程中,我們常將焦點放在演算法的選擇與模型的訓練上,但實際上,一個高效且穩健的模型,往往取決於資料的前處理與特徵的設計。隨著模型複雜度提升,過擬合、特徵尺度不一致以及高維資料噪聲等問題會
2025/10/24
3
《從零開始的資料科學筆記》Day#18: 資料具有時間特性怎麼訓練?
在現實生活中,許多資料並非靜止的,它們會隨著時間不斷變化,形成了一種特殊的資料型態,這就是時間序列資料。時間序列數據廣泛存在於各種領域,如金融市場的股票價格波動、氣候監測的溫度變化、製造業的機器故障檢測,以及網站流量的每日訪問量等。這些資料的最大特點在於:當前的觀測值與過去的值密切相關,未來的趨勢也
2025/10/11
3
《從零開始的資料科學筆記》Day#17: 沒有標籤如何分類?
在剛接觸機器學習時,會學習到模型是使用一組特徵X和標籤Y來訓練的,例如:使用房子的坪數、屋齡、地段等特徵可以預測這間房子的房價,這就是機器學習中迴歸分析的經典應用。但是在現實場景中,往往會出現數量龐大但是沒有明確標籤或類別的資料,這時應該怎麼利用這些資料,才能挖掘出潛藏在資料中的訊息?
2025/10/04
1
《從零開始的資料科學筆記》Day#16: 疾病診斷
疾病診斷在醫學領域中是一項非常重要的任務,正確的診斷能夠有效幫助患者及早接受治療,改善預後,並避免不必要的風險。然而,疾病診斷通常需要依賴大量且複雜的數據分析,例如病患的檢測數值、影像和臨床數據等。面對如此大量的資料,人工診斷可能會因主觀判斷或疲勞而存在不確定性,這便為機器學習和人工智慧提供了一個巨
2025/09/23
1
《從零開始的資料科學筆記》Day#15: 房價如何預測?
在學習完機器學習的各種基礎知識後,我們終於可以開始進入實際應用的階段。機器學習的常見應用大致可分為四大類:迴歸(Regression)、分類(Classification)、分群(Clustering)、以及時間序列分析(Time Series Analysis)。身為資料科學家,理解並掌握這些方法
2025/09/20
2
《從零開始的資料科學筆記》Day#14:機器學習流程-下
帶著大家簡單地看過整個機器學習流程之後,相信每個人對於機器學習在幹嘛還是很模糊,因此這章節來個實際範例,讓大家更了解在每一個流程中資料科學家究竟都在做什麼。 這裡我使用機器學習中很有名的”鳶尾花”資料集,這部分內容會比較多,希望大家可以跟著我的步驟慢慢地操作,細細地去體驗如何完成一個基本的機器學習
2025/07/25
《從零開始的資料科學筆記》Day#13:機器學習流程-中
在這個章節會繼續介紹機器學習後半部的流程,主要也是概念式的說明,每一個小細節在後續的文章中會再單獨拿出來說明。請大家盡量記得文章中每個流程所提到的專有名詞,大概了解每一個步驟在做什麼對於後續的學習很有幫助!
2025/07/19
查看更多
《從零開始的資料科學筆記》Day#22: 機器學習進階技巧四
📚 降維技術 降維是將高維數據轉換為低維表示的過程,同時保留數據的關鍵信息。這一技術對於現代機器學習至關重要,因為: 降低複雜度:減少特徵數量,簡化模型,加速訓練 消除冗餘:移除高度相關特徵,提高模型穩定性 減輕維度災難:在高維空間中,數據變得稀疏,距離度量失去意義 視覺化:將高維數據投
2025/12/07
3
《從零開始的資料科學筆記》Day#21: 機器學習進階技巧三
🧲 特徵轉換方法 特徵轉換是調整數值型特徵分布形態的過程,幫助模型更有效地學習和提高預測性能。良好的特徵轉換可以: 改善數據分布:使偏斜分布更加對稱 降低異常值影響:減少極端值對模型的干擾 捕捉非線性關係:讓線性模型可以學習複雜模式 提高訓練穩定性:加速梯度下降收斂過程
2025/11/22
《從零開始的資料科學筆記》Day#20: 機器學習進階技巧二
🪛 特徵編碼 為什麼需要特徵編碼? 特徵編碼是將非數值型資料(如類別、文本等)轉換為數值形式的過程,這是機器學習模型處理資料的必要步驟,因為: 模型數值需求:大多數機器學習算法只接受數值輸入,無法直接處理文字或類別資料 語義保存:編碼過程必須保留原始類別的語義信息,不同編碼方式會保留不同的
2025/11/08
1
《從零開始的資料科學筆記》Day#19: 機器學習進階技巧一
大家應該都實際練習過機器學習的四大技術了,包含迴歸分析、分類分析、分群分析以及時間序列分析。 在機器學習模型的開發過程中,我們常將焦點放在演算法的選擇與模型的訓練上,但實際上,一個高效且穩健的模型,往往取決於資料的前處理與特徵的設計。隨著模型複雜度提升,過擬合、特徵尺度不一致以及高維資料噪聲等問題會
2025/10/24
3
《從零開始的資料科學筆記》Day#18: 資料具有時間特性怎麼訓練?
在現實生活中,許多資料並非靜止的,它們會隨著時間不斷變化,形成了一種特殊的資料型態,這就是時間序列資料。時間序列數據廣泛存在於各種領域,如金融市場的股票價格波動、氣候監測的溫度變化、製造業的機器故障檢測,以及網站流量的每日訪問量等。這些資料的最大特點在於:當前的觀測值與過去的值密切相關,未來的趨勢也
2025/10/11
3
《從零開始的資料科學筆記》Day#17: 沒有標籤如何分類?
在剛接觸機器學習時,會學習到模型是使用一組特徵X和標籤Y來訓練的,例如:使用房子的坪數、屋齡、地段等特徵可以預測這間房子的房價,這就是機器學習中迴歸分析的經典應用。但是在現實場景中,往往會出現數量龐大但是沒有明確標籤或類別的資料,這時應該怎麼利用這些資料,才能挖掘出潛藏在資料中的訊息?
2025/10/04
1
《從零開始的資料科學筆記》Day#16: 疾病診斷
疾病診斷在醫學領域中是一項非常重要的任務,正確的診斷能夠有效幫助患者及早接受治療,改善預後,並避免不必要的風險。然而,疾病診斷通常需要依賴大量且複雜的數據分析,例如病患的檢測數值、影像和臨床數據等。面對如此大量的資料,人工診斷可能會因主觀判斷或疲勞而存在不確定性,這便為機器學習和人工智慧提供了一個巨
2025/09/23
1
《從零開始的資料科學筆記》Day#15: 房價如何預測?
在學習完機器學習的各種基礎知識後,我們終於可以開始進入實際應用的階段。機器學習的常見應用大致可分為四大類:迴歸(Regression)、分類(Classification)、分群(Clustering)、以及時間序列分析(Time Series Analysis)。身為資料科學家,理解並掌握這些方法
2025/09/20
2
《從零開始的資料科學筆記》Day#14:機器學習流程-下
帶著大家簡單地看過整個機器學習流程之後,相信每個人對於機器學習在幹嘛還是很模糊,因此這章節來個實際範例,讓大家更了解在每一個流程中資料科學家究竟都在做什麼。 這裡我使用機器學習中很有名的”鳶尾花”資料集,這部分內容會比較多,希望大家可以跟著我的步驟慢慢地操作,細細地去體驗如何完成一個基本的機器學習
2025/07/25
《從零開始的資料科學筆記》Day#13:機器學習流程-中
在這個章節會繼續介紹機器學習後半部的流程,主要也是概念式的說明,每一個小細節在後續的文章中會再單獨拿出來說明。請大家盡量記得文章中每個流程所提到的專有名詞,大概了解每一個步驟在做什麼對於後續的學習很有幫助!
2025/07/19
查看更多
《從零開始的Python筆記》
《從零開始的Python筆記》Day#8:Python魔法糖-裝飾器(下)
✍️ 常見裝飾器應用範例 計時器 計算函數運行的時間 運算時間對於機器學習模型來說非常重要,這會影響到模型訓練與部署推論的資源需求
2025/09/01
3
《從零開始的Python筆記》Day#8:Python魔法糖-裝飾器(上)
Python系列的筆記到這邊就差不多要告個段落,我介紹了基礎語法與進階語法的功能與使用方式。基礎語法對於初學者來說是滿容易理解而且能快速上手的部分,進階語法則是初學者的噩夢,常常讓人難以理解也不知道怎麼使用,不過它卻是讓大家提升程式設計能力的好工具。 一開始大家不需要去死記硬背這些進階語法,只需要大
2025/09/01
4
《從零開始的Python筆記》Day#7:迭代器與生成器
這篇筆記主要是介紹資料科學家的好朋友:迭代器和生成器! 迭代器與生成器是大家在處理資料以及訓練模型時常常會使用到的工具,請務必熟悉他們的用法!!!
2025/08/23
3
《從零開始的Python筆記》Day#6:物件導向設計
大部分在學習程式語言的人很常會看到或是聽到一個很抽象的詞:物件導向 對於初學者來說,又出現了一個很難以理解的名詞,而且在學習上的確也是很常讓人碰壁的一部分。雖然有著不小的學習障礙,但是對於提升程式設計能力有很大的幫助,因此建議大家可以多點耐心去接觸並且練習如何使用它。
2025/08/16
2
《從零開始的Python筆記》Day#5:例外與檔案處理
學習到這個階段,大家如果都有跟上的話已經可以試著自行開發一些工具或是演算法了。不過Python還有提供許多進階的功能可以幫助我們在開發的過程中更順暢、更有效率。 ⚠️ 例外處理 (Exception)
2025/08/14
2
《從零開始的Python筆記》Day#4:模組化三劍客-函數,模組,與套件
學完Python的基礎課程後,大家對於Python已經有了一定程度的了解,可以開始踏入Python進階的課程了! 這邊將介紹 Python 中的函數、模組與套件,這些技巧可以提升結構化、模組化程式的能力,讓程式碼更易於維護、重用與共享。
2025/08/13
《從零開始的Python筆記》Day#3:攻克Python資料結構
資料結構是程式設計的核心基石,直接影響演算法的效率與軟體設計的品質。在開發軟體工具時,選擇合適的資料結構不僅是解決問題的關鍵,也是實現高效與穩健程式的重要步驟。 Python 提供了多樣化的內建資料結構,每一種結構都針對特定的任務情境進行了優化設計。接下來,我們將深入探討這些資料結構的特性與用法,
2025/08/09
《從零開始的Python筆記》Day#2:流程控制與迴圈
🔄流程控制 條件判斷 條件判斷語句允許程式執行不同的代碼,依條件結果決定程式執行的邏輯。 if:用於判斷條件是否成立,若成立即執行對應程式碼。 elif:用於指定額外條件,當上方的 if 條件不成立時檢查其他可能性。 else:當所有條件皆不成立時執行。
2025/08/03
1
《從零開始的Python筆記》Day#1:初見Python
這篇筆記會從最基本最基礎最簡單的語法開始介紹,請大家務必熟悉每一個語法和功能。
2025/08/03
《從零開始的Python筆記》Day#0:上船了
在學習 Python 之前,我們需要首先了解 Python 是什麼、它的優缺點,以及它如何應用於不同領域。這一系列筆記將帶著你從基本概念開始,進一步認識 Python 的重要性,特別是對於 AI 、資料科學領域的價值。
2025/07/19
查看更多
《從零開始的Python筆記》Day#8:Python魔法糖-裝飾器(下)
✍️ 常見裝飾器應用範例 計時器 計算函數運行的時間 運算時間對於機器學習模型來說非常重要,這會影響到模型訓練與部署推論的資源需求
2025/09/01
3
《從零開始的Python筆記》Day#8:Python魔法糖-裝飾器(上)
Python系列的筆記到這邊就差不多要告個段落,我介紹了基礎語法與進階語法的功能與使用方式。基礎語法對於初學者來說是滿容易理解而且能快速上手的部分,進階語法則是初學者的噩夢,常常讓人難以理解也不知道怎麼使用,不過它卻是讓大家提升程式設計能力的好工具。 一開始大家不需要去死記硬背這些進階語法,只需要大
2025/09/01
4
《從零開始的Python筆記》Day#7:迭代器與生成器
這篇筆記主要是介紹資料科學家的好朋友:迭代器和生成器! 迭代器與生成器是大家在處理資料以及訓練模型時常常會使用到的工具,請務必熟悉他們的用法!!!
2025/08/23
3
《從零開始的Python筆記》Day#6:物件導向設計
大部分在學習程式語言的人很常會看到或是聽到一個很抽象的詞:物件導向 對於初學者來說,又出現了一個很難以理解的名詞,而且在學習上的確也是很常讓人碰壁的一部分。雖然有著不小的學習障礙,但是對於提升程式設計能力有很大的幫助,因此建議大家可以多點耐心去接觸並且練習如何使用它。
2025/08/16
2
《從零開始的Python筆記》Day#5:例外與檔案處理
學習到這個階段,大家如果都有跟上的話已經可以試著自行開發一些工具或是演算法了。不過Python還有提供許多進階的功能可以幫助我們在開發的過程中更順暢、更有效率。 ⚠️ 例外處理 (Exception)
2025/08/14
2
《從零開始的Python筆記》Day#4:模組化三劍客-函數,模組,與套件
學完Python的基礎課程後,大家對於Python已經有了一定程度的了解,可以開始踏入Python進階的課程了! 這邊將介紹 Python 中的函數、模組與套件,這些技巧可以提升結構化、模組化程式的能力,讓程式碼更易於維護、重用與共享。
2025/08/13
《從零開始的Python筆記》Day#3:攻克Python資料結構
資料結構是程式設計的核心基石,直接影響演算法的效率與軟體設計的品質。在開發軟體工具時,選擇合適的資料結構不僅是解決問題的關鍵,也是實現高效與穩健程式的重要步驟。 Python 提供了多樣化的內建資料結構,每一種結構都針對特定的任務情境進行了優化設計。接下來,我們將深入探討這些資料結構的特性與用法,
2025/08/09
《從零開始的Python筆記》Day#2:流程控制與迴圈
🔄流程控制 條件判斷 條件判斷語句允許程式執行不同的代碼,依條件結果決定程式執行的邏輯。 if:用於判斷條件是否成立,若成立即執行對應程式碼。 elif:用於指定額外條件,當上方的 if 條件不成立時檢查其他可能性。 else:當所有條件皆不成立時執行。
2025/08/03
1
《從零開始的Python筆記》Day#1:初見Python
這篇筆記會從最基本最基礎最簡單的語法開始介紹,請大家務必熟悉每一個語法和功能。
2025/08/03
《從零開始的Python筆記》Day#0:上船了
在學習 Python 之前,我們需要首先了解 Python 是什麼、它的優缺點,以及它如何應用於不同領域。這一系列筆記將帶著你從基本概念開始,進一步認識 Python 的重要性,特別是對於 AI 、資料科學領域的價值。
2025/07/19
查看更多
加入沙龍