【茶水間 AI 實戰】第四卷:古典流派的逆襲 AI 不是只有深度學習? 決策樹 × SVM × XGBoost

更新 發佈閱讀 13 分鐘

雖然「生成式 AI」最近在數位行銷公司出盡風頭,但當老闆丟給你一份幾百萬筆客戶分類的 Excel 報表,要求預測下個月的營收時,那些會畫圖、會寫詩的生成式 AI 竟然全部傻眼!

在這一篇《白話實驗室》中,我們將重返 Brainstorm 數位行銷公司的財務審核室。這一次,我們不談天馬行空的創意,而是要喚醒數據界身經百戰的老將們,準備好迎接「古典流派的逆襲」吧!


📖 第四卷:古典流派的逆襲(傳統機器學習)

(畫面轉場)

「歡迎來到白話實驗室。」

我是日野遼。如果你以為現在的 AI 只有 GPT 或 MidJourney,那就大錯特錯了。在真實的商業世界裡,真正幫公司賺錢、算機率、做預測的,往往是那些名字聽起來很老派的「傳統機器學習」模型。

今天,首席研究員「宙猩」將帶我們認識這群不搞創意、只看數據的冷酷精算師。看看他們是如何在雜亂無章的報表中,一眼看穿客戶的錢包!


Step 1: 職場情境劇 (Story Mode)

🎬 劇名:《財務報表與數據老將的逆襲》

【主要角色】

  • Jason(行銷總監 / 慣老闆): 拿著雜亂的客戶 Excel 表,想知道誰會買單,誰只是來逛逛。
  • 艾莉 (Elly): 負責調度「機器學習老將」的數據戰術分析師。
  • 老陳(資深會計): 在公司待了 20 年,性格古板但判斷精準的人類代表。

【劇情開始】 地點:Brainstorm 行銷公司 財務審核室。

「艾莉,那些會畫圖的 AI 漂亮是漂亮,但這張報表它們讀不懂啊!」Jason 拍著桌子,「我只想知道,廣告預算投下去,營收會長多少?還有這群客戶,到底會不會下單?」

艾莉推了推眼鏡:「總監,對付數據報表,我們不需要藝術家,我們需要的是『統計精算師』。這就是傳統機器學習的戰場。」

1. 鐵口直斷的算命師:回歸系列與 SVM

「如果您想預測具體的數字,比如『明年業績會漲幾趴』,我們要請出 線性回歸 (Linear Regression)。」艾莉畫了一條直線,「它就像老陳,看著過去的成長趨勢,拉出一條直線預測未來。」

「那如果只是要分『買』或『不買』呢?」

「那就是 邏輯回歸 (Logistic Regression)。」艾莉解釋,「雖然它名字裡有回歸,但它其實是個『二選一裁決官』,專門處理這種是非題。」

「如果客戶資料很亂,分不清楚呢?」Jason 追問。

「那就請 SVM (支持向量機) 出場。它就像一個專業保全,會在兩群人之間強行劃出一條『最寬的緩衝區』,把好客與奧客分得清清楚楚。」

2. 團隊合作的選舉大戰:決策樹與集成學習

「我有個更簡單的方法,」Jason 說,「叫大家投票決定不就好了?」

「這就是 集成學習 (Ensemble) 的精髓!」艾莉眼睛一亮,「決策樹 (Decision Tree) 就像是一個愛問問題的實習生,問完『有沒有錢?』、『有沒有需求?』後做決定。但一個實習生容易偏頗,所以我們找來一百個實習生組成 隨機森林 (Random Forest)。」

艾莉接著比喻:「這種『大家同時投票,少數服從多數』的方法叫 Bagging;但如果我們讓實習生輪流練習,後一個專門修正前一個的錯誤,這種接力賽的訓練法就叫 Boosting。」

3. 數據界的超跑:三巨頭

「最後,為了對付您那幾百萬筆的廣告數據,我們有三台採用 Boosting 技術的超跑。」艾莉秀出三張規格表:

  • XGBoost:拿過無數數據競賽冠軍的『全能超跑』。
  • LightGBM:專門處理大數據,『速度最快』的跑車。
  • CatBoost:專門對付報表裡的文字類別(如城市、職業),是『類別資料專家』。

Jason 點點頭:「懂了。生成式 AI 是美編,這些機器學習老將才是我的軍師跟會計啊!」


Step 2: 觀念對照表 (Decoding)

🐒 宙猩解碼時間 看懂了這群數據老將的專長,是不是覺得傳統演算法其實非常直觀?現在,跟著宙猩一起,把這些精算神技嚴格對齊到正式的技術專有名詞上:

  • 📈 線性回歸 (Linear Regression)
    • 白話解析: 看趨勢算數字的算命仙。
    • 核心概念: 透過擬合一條直線,來預測連續數值(例如:房價、點擊率、營收)。
  • ⚖️ 邏輯回歸 (Logistic Regression)
    • 白話解析: 二選一裁決官。
    • 核心概念: 雖然名為回歸,但主要用於處理二元分類問題(例如:買/不買、是/否)。
  • 🚧 SVM (支持向量機)
    • 白話解析: 強行劃分緩衝區的保全。
    • 核心概念: 尋找能最大化間隔 (Margin) 的超平面,將不同類別的資料清晰分開。
  • 🌳 決策樹 (Decision Tree)
    • 白話解析: 邏輯問答題實習生。
    • 核心概念: 呈現樹狀結構,根據特徵屬性一層層進行邏輯判斷與分類。
  • 🤝 集成學習 (Ensemble)
    • 白話解析: 團結力量大的投票大會。
    • 核心概念: 結合多個弱學習器(如多棵樹)來提升整體的預測準確度與穩定性。
  • 🌲 隨機森林 (Random Forest)
    • 白話解析: 百人投票大會。
    • 核心概念: 集成學習的一種,由多棵獨立並行生成的決策樹組成,最終取多數決。
  • 🛍️ Bagging
    • 白話解析: 大家同時並行投票。
    • 核心概念: Bootstrap Aggregating 的簡稱,透過並行訓練多個獨立模型來降低變異性(如隨機森林)。
  • 🏃‍♂️ Boosting
    • 白話解析: 後浪補前浪的接力賽。
    • 核心概念: 序列式的集成學習,後面的模型重點學習並修正前面模型預測錯誤的樣本。
  • 🏎️ XGBoost
    • 白話解析: 數據競賽的全能冠軍。
    • 核心概念: 極度優化過的梯度提升樹 (GBDT) 演算法,效能與準確率極高。
  • ⚡ LightGBM
    • 白話解析: 速度最快的大數據跑車。
    • 核心概念: 微軟開發的演算法,使用直方圖與單邊梯度採樣,訓練速度極快、佔用記憶體小。
  • 🐈 CatBoost
    • 白話解析: 類別資料處理專家。
    • 核心概念: Yandex 開發,原生支援且完美處理類別型特徵(Categorical Features),無需手動轉換。

Step 3: 職場情境探討 (Apply Mode)

👓 日野遼的實戰道場 理解了這群數據老將的強項,現在換你來當總監點將了!宙猩準備了 3 個真實的職場情境,看看你能不能精準派對模型出場解決問題:

📝 【情境 1|預測數值與分類的抉擇】

Brainstorm 公司想要預測「下一季的具體廣告點擊次數」。如果總監指名要用「邏輯回歸 (Logistic Regression)」,你會怎麼建議他?

💡 正確答案:請總監改用「線性回歸」或 XGBoost。

🧠 原理白話解: 「廣告點擊次數」是連續不斷變化的具體數字。邏輯回歸雖然名字裡有「回歸」,但它是專門用來做「分類」的(例如預測這則廣告「會 / 不會」被點擊)。要預測具體連續數值,必須派線性回歸出場。

📝 【情境 2|團隊合作模式的差異】

工程師在報告時提到,他們使用了「隨機森林」來預測客戶流失率,並說這是一種「讓後面的樹去修正前面的樹的錯誤」的技術。這句話哪裡有問題?

💡 正確答案:「隨機森林」是 Bagging(並行),不是 Boosting(串行)。

🧠 原理白話解: 隨機森林的邏輯是「大家同時投票(Bagging)」,每棵決策樹都是獨立作業、互不干擾的。真正「後浪推前浪、讓後面模型修正前面錯誤」的接力賽技術,叫做 Boosting(例如 XGBoost)。

📝 【情境 3|處理繁雜的文字類別報表】

客戶傳來一份高達兩百萬筆的會員資料,裡面包含大量的「居住城市」、「職業」、「喜好標籤」等純文字類別特徵。為了節省手動把文字轉成數字的處理時間,該派哪台超跑出場?

💡 正確答案:派出「CatBoost」

🧠 原理白話解: CatBoost 的 "Cat" 就是 Categorical(類別)的縮寫。它天生內建了處理這類文字標籤的強大機制,不需要工程師辛苦地做 One-Hot Encoding(特徵轉換),是處理類別資料的最佳解答。


Step 4: 洗腦速記表 (Cheat Sheet)

🦍 宙猩的速記大補帖 傳統機器學習名詞太像?把這份口訣存進手機,開會或提案前瞄一眼,11 個名詞瞬間解鎖,讓老闆覺得你超級專業!

  • 📈 線性回歸 👉 拉出一條線,預測能變現(算數值)
  • ⚖️ 邏輯回歸 👉 雖然叫回歸,分類站好隊(判是非)
  • 🚧 SVM 👉 劃清楚河界,緩衝最優越(切蛋糕)
  • 🌳 決策樹 👉 邏輯問答題,一步步分析(20個問題)
  • 🤝 集成學習 👉 團結力量大,模型一起上(打群架)
  • 🛍️ Bagging 👉 同時並行投,大家一起謀(平行投票)
  • 🌲 隨機森林 👉 森林大投票,穩健又可靠(Bagging代表)
  • 🏃‍♂️ Boosting 👉 弱弱相扶持,後浪補前失(接力修正)
  • 🏎️ XGBoost 👉 效能大怪物,競賽常勝軍(全能超跑)
  • LightGBM 👉 運算快如光,大數據最香(光速超跑)
  • 🐈 CatBoost 👉 類別資料來,通通它來排(類別專家)

🚀 下集預告:第五卷 內功心法(學習範式)

如果說今天介紹的 回歸、SVM、決策樹與 Boosting 是 AI 手中的「武器」, 那麼真正決定 AI 能不能變強的,其實是 它的學習方式

在下一集《白話實驗室》中, 日野遼與宙猩將帶大家走進 AI 的訓練營。

我們將揭開三種最核心的學習模式:

  • 監督學習(Supervised Learning):老師給答案的標準訓練法
  • 無監督學習(Unsupervised Learning):AI 自己找規律
  • 強化學習(Reinforcement Learning):做對就給獎勵的遊戲訓練

原來 AI 並不是「突然變聰明」, 而是透過不同的學習方式,一步一步修煉出來的。


💬 互動問題

如果你是 Brainstorm 公司的 AI 顧問, 遇到下面三個任務,你會派誰出場?

A. 公司想預測「下一季營收成長率」 (要得到一個具體數字)

B. 行銷部想判斷「哪些客戶會購買新產品」 (只有會 / 不會兩種結果)

C. 客戶資料有 200 萬筆, 裡面包含大量 城市、職業、興趣標籤 等文字類別資料

留言告訴 宙猩 你的答案與理由!

我們下一集《白話實驗室》見。 🐒


✦ White-Lab 本篇重點

當 AI 不只是會 畫圖、寫文章, 還能 預測數據、分析客戶、計算風險, 它背後其實依賴的是 傳統機器學習模型

在本篇《白話實驗室》中, 我們透過 職場情境劇與真實商業案例, 解析以下核心技術:

  • 線性回歸(Linear Regression)
  • 邏輯回歸(Logistic Regression)
  • SVM(支持向量機)
  • 決策樹(Decision Tree)
  • 集成學習(Ensemble)
  • Random Forest
  • Bagging
  • Boosting
  • XGBoost
  • LightGBM
  • CatBoost

帶你理解 AI 在真實商業世界裡如何做決策與預測。


📚 教材章節對應索引(WHITE LAB|Vol.04)

本篇為《第四卷:古典流派的逆襲(傳統機器學習)》之導讀總覽故事, 內容涵蓋以下教材章節之核心技術定義:

🔹第四卷 第一章:回歸與邊界

  • 線性回歸(Linear Regression)
  • 邏輯回歸(Logistic Regression)
  • SVM(支持向量機)

🔹第四卷 第二章:樹狀模型與集成

  • 決策樹(Decision Tree)
  • 集成學習(Ensemble)
  • 隨機森林(Random Forest)
  • Bagging
  • Boosting

🔹第四卷 第三章:梯度提升三巨頭

  • XGBoost
  • LightGBM
  • CatBoost

📌 本卷共收錄 11 項傳統機器學習專有名詞, 作為後續「古裝版教材」、「iPAS 模擬題」與「觀念對照卡」生成之唯一依據。

留言
avatar-img
WHITE LAB|白話實驗室的沙龍
0會員
11內容數
透過職場情境與白話比喻, 將 CNN、Transformer、Agent 等生成式 AI 概念, 轉譯為非工程背景也能理解的知識內容。
2026/03/05
本篇以武俠情境解析 AI 大腦架構,介紹 CNN、RNN 與 Transformer 在處理影像與序列資料時的差異。透過情報陣法失靈案例,說明長距離依賴問題與自注意力機制,並延伸至 Transformer-XL 與自編碼器在長文本處理與資料壓縮上的應用,協助建立生成式 AI 核心模型理解。
Thumbnail
2026/03/05
本篇以武俠情境解析 AI 大腦架構,介紹 CNN、RNN 與 Transformer 在處理影像與序列資料時的差異。透過情報陣法失靈案例,說明長距離依賴問題與自注意力機制,並延伸至 Transformer-XL 與自編碼器在長文本處理與資料壓縮上的應用,協助建立生成式 AI 核心模型理解。
Thumbnail
2026/03/03
當 AI 不只會分析資料,還能「無中生有」生成圖片與文案,它背後到底運用了哪些技術? 在本篇《白話實驗室》中,我們重返 Brainstorm 行銷公司的創意會議室,用白話故事解析生成模型家族的核心架構,從 GAN、VAE 到 Diffusion 模型,帶你看懂 AI 如何從大量資料中學會創造新內容。
Thumbnail
2026/03/03
當 AI 不只會分析資料,還能「無中生有」生成圖片與文案,它背後到底運用了哪些技術? 在本篇《白話實驗室》中,我們重返 Brainstorm 行銷公司的創意會議室,用白話故事解析生成模型家族的核心架構,從 GAN、VAE 到 Diffusion 模型,帶你看懂 AI 如何從大量資料中學會創造新內容。
Thumbnail
2026/02/28
本文透過武俠情境,生動比喻並介紹了 GPT、DALL-E、MidJourney、Stable Diffusion 及 CLIP 等生成式 AI 工具的應用。文章以「神機營」為背景,將 AI 工具擬人化為「傳世法寶」,說明如何在緊迫時限內,利用這些法寶解決安家山莊的危機。
Thumbnail
2026/02/28
本文透過武俠情境,生動比喻並介紹了 GPT、DALL-E、MidJourney、Stable Diffusion 及 CLIP 等生成式 AI 工具的應用。文章以「神機營」為背景,將 AI 工具擬人化為「傳世法寶」,說明如何在緊迫時限內,利用這些法寶解決安家山莊的危機。
Thumbnail
看更多
你可能也想看
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
人工智慧的核心認知,從機器學習的參數訓練到生成式 AI 的機率預測本質基本概念,將 AI 視為「工具人」的協作思維,初學者無需具備程式背景,也能在 AI 時代高效解決問題,掌握與虛擬助理共事的關鍵能力。
Thumbnail
人工智慧的核心認知,從機器學習的參數訓練到生成式 AI 的機率預測本質基本概念,將 AI 視為「工具人」的協作思維,初學者無需具備程式背景,也能在 AI 時代高效解決問題,掌握與虛擬助理共事的關鍵能力。
Thumbnail
AI 熱潮下,哪些才是真趨勢?本文提煉 5 個反直覺洞察:AI 將從雲端走向邊緣、從工具變同事、從省時變成「野心放大器」。瓶頸不在技術而在「人」,且 AI 終極任務是傳承人類智慧。這不僅是科技變革,更是人性叩問。掌握這些,在 AI 時代找到你的關鍵定位。
Thumbnail
AI 熱潮下,哪些才是真趨勢?本文提煉 5 個反直覺洞察:AI 將從雲端走向邊緣、從工具變同事、從省時變成「野心放大器」。瓶頸不在技術而在「人」,且 AI 終極任務是傳承人類智慧。這不僅是科技變革,更是人性叩問。掌握這些,在 AI 時代找到你的關鍵定位。
Thumbnail
您是否常在會議中聽到 AI、機器學習、深度學習、生成式 AI、LLM 等名詞,卻感到混淆?本文將透過由外而內的五個同心圓,清晰地解釋這些名詞的定義、彼此之間的層級關係,以及它們的學習方式(監督學習、非監督學習、強化學習)。無論您是技術背景或非技術背景,都能藉此快速釐清概念,更精準地與他人溝通。
Thumbnail
您是否常在會議中聽到 AI、機器學習、深度學習、生成式 AI、LLM 等名詞,卻感到混淆?本文將透過由外而內的五個同心圓,清晰地解釋這些名詞的定義、彼此之間的層級關係,以及它們的學習方式(監督學習、非監督學習、強化學習)。無論您是技術背景或非技術背景,都能藉此快速釐清概念,更精準地與他人溝通。
Thumbnail
本文整理 Google 數位人才探索計畫課程「Introduction to Generative AI」的重點,介紹生成式 AI 的定義、運作原理與應用範疇,並釐清 AI、機器學習與深度學習關聯。課程涵蓋大型語言模型(LLM)、Transformer 架構,並說明在文字、圖像、程式、語音領域應用。
Thumbnail
本文整理 Google 數位人才探索計畫課程「Introduction to Generative AI」的重點,介紹生成式 AI 的定義、運作原理與應用範疇,並釐清 AI、機器學習與深度學習關聯。課程涵蓋大型語言模型(LLM)、Transformer 架構,並說明在文字、圖像、程式、語音領域應用。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News