夕月Noah-avatar-img

夕月Noah

0 位追蹤者

夕月Noah

0 位追蹤者
avatar-img
夕月之下
0會員
8內容數
在模型尚未收斂前,記下語言的提示與意圖。觀察者、語言與語言模型的交界。
全部內容
由新到舊
本文分享在 Kaggle House Price挑戰中的實作經驗。在不進行複雜特徵工程的前提下,利用 KNN Imputer 和 Simple Imputer 自動補齊欄位的缺失值,並透過GA為四種模型尋找最佳超參數。最終透過模型融合得到成績。
Thumbnail
這篇是Titanic 生還預測:Machine Learning from Disaster原先後面有的補充資料,因為字數限制另外開到這篇寫。透過 Optuna,我們可以讓模型自主尋找最佳的特徵組合和參數設定,大幅提升實驗效率。
這篇文章記錄了我第一次進行鐵達尼號比賽,以及後來又再度認真的玩這個比賽的過程,會介紹一下我最終的code以及最一開始到最終的心路歷程,分享給大家做參考。
Thumbnail
本文簡單地介紹線性模型、樹模型和神經網路三大類機器學習模型,並結合Kaggle比賽實戰經驗,說明模型選擇、超參數調整、模型融合和模型解釋等關鍵技術。
Thumbnail
這篇介紹特徵工程在 Kaggle 專案中的重要性,並詳細說明數值型和類別型特徵的處理技巧,包含標準化、正規化、分箱、數值轉換、Label Encoding...等方法。文章說明各個技巧的應用場景和注意事項,並說明如何提升模型的預測能力。
Thumbnail
這篇文章討論機器學習中資料清理的重要性,並說明缺失值、異常值、資料型別錯誤、類別不一致和樣本不均衡等常見問題的處理方法。文章強調理解資料的重要性,並指出資料清理不是單選題,而是一場需要不斷嘗試和驗證的旅程。
Thumbnail
本文介紹作者在機器學習學到並整理的基礎概念、流程與重要元素,並以自身學習歷程,說明資料清理的重要性,點出機器學習並非僅僅是讓機器學習演算法運作,更包含資料前處理、特徵工程等環節。
Thumbnail
語言模型不會作夢,但我懷疑,那些 Mask 掉的詞,正是我們沒說出的話。 這裡是我用來記錄模糊語意、模型行為,以及偶爾流進來的情緒雜訊之處。 我叫夕月,這裡,是語言與模型之間的縫隙,也是我與自己的實驗場。 關於我 --我是一位馬達設計工程師,對AI、資料科學有很深的興趣,正在從電機領域轉向 A
Thumbnail