GBDT（Gradient Boosting Decision Tree，梯度提升決策樹）

iPAS AI應用規劃師學習筆記

發佈於數據準備與模型選擇

2025/09/08 更新2025/09/08 發佈閱讀 2 分鐘

GBDT（Gradient Boosting Decision Tree，梯度提升決策樹）是一種集成學習算法，由多棵決策樹串聯組成，通過逐步擬合前一棵樹預測誤差來提升整體模型性能。GBDT在多種任務中表現優秀，尤其適用於結構化數據分析。

GBDT 與高維稀疏數據應用：

處理稀疏數據能力：GBDT能有效處理缺失值和稀疏特徵，比如用於文本分類中的詞袋模型，或用戶行為中的二元特徵（有/無）。
特別優化：一些GBDT實現如XGBoost、LightGBM針對稀疏數據有專門設計，能自動處理缺失值並利用稀疏性加速計算。
過擬合風險：在高維稀疏數據中，GBDT容易過擬合，因為樹模型可能過分擬合少數關鍵特徵，導致泛化能力下降。
正則化幫助：正則化技術（如樹的深度限制、葉節點數限制、特徵子集抽樣）幫助減少過擬合，提升稀疏數據上的性能。

GBDT的優點：

表達能力強，能自動捕捉特徵間非線性關系，
不需複雜特徵預處理，對數據尺度不敏感，
強可解釋性，易於理解決策過程。

限制：

高維稀疏場合下，效果可能不如正則化良好的線性模型或深度神經網路，
訓練計算資源消耗較大，難以處理超大規模數據。

總結來說，GBDT在高維稀疏數據中有一定優勢，尤其是在特徵自動選擇和缺失值處理方面，適合多數結構化場景，但要防止過擬合及提升可擴展性，需合理參數調整與算法優化。

含 AI 應用內容

郝信華 iPAS AI應用規劃師學習筆記數據準備與模型選擇

留言

留言分享你的想法！

郝信華 iPAS AI應用規劃師學習筆記

31會員

495內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師 (初級) AWS Certified AI Practitioner (AIF-C01) 經濟部 iPAS AI應用規劃師數據分析 (中級)

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/09/08

高維稀疏數據

高維稀疏數據是指同時具備兩個特徵的數據類型：高維度（High-Dimensional）：數據具有非常多的特徵維度，可能從數百、數千到數萬，甚至上百萬。比如詞袋模型中詞彙表的大小、使用One-Hot編碼時產生的維度。稀疏性（Sparsity）：在這些高維空間中，大部分特徵值多為零或缺失，只

2025/09/08

高維稀疏數據

2025/09/08

線性可分

在線性分類問題中，「線性可分」是指數據集中的不同類別樣本可以被一條（或一個）線性決策邊界完全分開，且沒有任何誤分類的現象。具體定義： - 在二維空間中，線性可分意味著存在一條直線，能將所有屬於類別A的數據點和類別B的數據點完全分隔到直線的兩側。 - 在更高維度中，這條直線對應的是一個超平面

2025/09/08

線性可分

2025/09/05

Bootstrap

Bootstrap 是一種統計和機器學習中常用的重抽樣技術，通過從原始數據集中「有放回地」多次抽取樣本，生成多組新的訓練數據集（稱為Bootstrap樣本），用以估計統計量的分布，提升模型穩定性和泛化能力。 Bootstrap的主要特點：有放回抽樣**：從原數據集中抽取樣本，抽取後的樣本可被再

2025/09/05

Bootstrap

看更多

你可能也想看

Celine 寫在這裡

香氛藝術家 sunkronizo perfume︱以香氛同步日常節奏的台灣獨立調香師品牌

嶄新的台灣獨立調香師品牌Sunkronizo ，這個名稱源自希臘語「同步」的意思。讓香氛不單純只是氣味調製，更是個人風格的展現與靈魂意志延伸的一種溝通語言。很適合接下來年底聖誕佳節送禮的試香組，以一星期中的日子來為全系列香氛產品命名，是品牌創立後首個推出全系列概念作品...

#香水#香水評論#試香

2025/11/25

Celine 寫在這裡

香氛藝術家 sunkronizo perfume︱以香氛同步日常節奏的台灣獨立調香師品牌

#香水#香水評論#試香

2025/11/25

awwrated的沙龍

【編輯現場】當世界都想看台灣故事：VOD 串流如何引爆下一個「台流」？

根據美國電影協會（MPA）主辦的「串流服務如何推動臺灣創意經濟」論壇內容，深入探討串流平臺對臺灣影視產業的影響、數據分析、政府政策建議、內容國際化策略，以及臺灣與「韓流」的差距。文章提出 awwrated 在串流生態系中的潛在角色，強調數據、策略與自信是臺灣影視產業發展的關鍵。

#awwrated#Netflix#NETFLIX影集

2025/11/21

awwrated的沙龍

【編輯現場】當世界都想看台灣故事：VOD 串流如何引爆下一個「台流」？

#awwrated#Netflix#NETFLIX影集

2025/11/21

月刊龍貓大王通信

進入串流大戰第二階段！台灣影視作品如何透過全球VOD平台對外發聲？這是來自美國電影協會的觀察

本文探討串流平臺（VOD）如何徹底改變好萊塢和臺灣影視產業的生態。從美國電影協會（MPA）的數據報告，揭示串流服務在臺灣的驚人普及率與在地內容的消費趨勢。文章分析國際作品如何透過在地化元素開拓新市場。同時，作者也擔憂政府過度監管可能扼殺臺灣影視創新自由，以越南為鑑，呼籲以開放態度擁抱串流時代的新機遇

#電影產業#全球在地化#串流平台

2025/11/24