決策樹、SVM 與 K-means:深入理解分類與分群算法,冰淇淋行為實例解析

更新 發佈閱讀 3 分鐘

前言

在學習 機器學習AI 的過程中,我們會接觸到許多不同的算法,而其中有三個算法經常會讓人混淆,它們分別是 決策樹(Decision Tree)支持向量機(SVM)K-means。雖然它們都用來處理資料,但每一個算法的應用場景和運作方式都有所不同。為了讓大家更容易理解這三個算法,這篇文章將用簡單的例子來解釋每個算法的分析原理性質,並且幫助大家進一步了解它們在AI系統中的運作,無論是在學習過程中還是準備考試時,這些例子都能幫助你更快速地掌握這些概念。


1. 決策樹(Decision Tree)

  • 分析原理:決策樹是從大範圍的資料開始,根據每個特徵逐步提問來進行分類,最終將資料歸類到特定的類別。每個節點是根據特徵來分支,直到資料點被分配到葉子節點。
  • 性質分類
    • 原因:決策樹通過對資料進行分支,最終將資料分類成不同的類別。
  • 冰淇淋的例子
    • 決策樹會先問:「天氣是否炎熱?」如果答案是「是」,接著會問:「顧客年齡是否在18歲以上?」如果答案是「是」,那麼預測顧客會購買冰淇淋

2. 支持向量機(SVM)

  • 分析原理:支持向量機是基於資料的特徵,尋找最佳的分界線,將資料分為兩類,像是在二維空間中進行聚焦,最大化兩類之間的距離來提升分類精確度。
  • 性質分類
    • 原因:SVM 將資料點分類為兩類,並找到最佳分界線來最大化分類的準確性。
  • 冰淇淋的例子
    • 支持向量機會根據顧客的年齡天氣來畫出一條分界線,顧客年齡小於35歲且天氣炎熱的顧客會被劃分為「會購買冰淇淋」的一類,年齡大且天氣涼爽的顧客會被劃分為「不會購買冰淇淋」的另一類。

3. K-means

  • 分析原理:K-means 是從大範圍的資料開始,根據資料的相似性將資料自動分為幾個群組。每個群組的資料點內部相似性高,群組間的資料點差異大,直到群組分配不再改變。
  • 性質分群
    • 原因:K-means 用來將資料分成幾個群組,並依據顧客的相似性來自動分組。
  • 冰淇淋的例子
    • K-means 會將顧客根據年齡購買冰淇淋的時間(如夏天購買)自動分為兩個群組:
      • 年輕顧客群(例如25歲以下的顧客,並且夏天購買冰淇淋的顧客會放一組),
      • 年長顧客群(例如年齡較大的顧客,可能會放在另一組,並且依然會購買冰淇淋)。
    • 接著,K-means會根據顧客特徵再次調整群組的邊界,逐步內縮,直到群組穩定不變,每個群體的顧客特徵更加相似。

總結彙整:

raw-image



留言
avatar-img
留言分享你的想法!
avatar-img
靈感補給站|隨筆 × 商業 × 創作
3會員
92內容數
📖 財會背景|內部稽核師(CIA)/ERP軟體應用師 上班靠邏輯,下班靠靈感。 寫吃的、寫日常,也寫世界的眉角。 ✨
2025/05/04
技術債不是寫程式才有,它也藏在ERP報表、雲端流程、AI模型裡。這篇文章從日常系統操作出發,帶你看見那些「先這樣跑就好」背後的長期代價。看不見的債,總在你最忙的時候來討。
Thumbnail
2025/05/04
技術債不是寫程式才有,它也藏在ERP報表、雲端流程、AI模型裡。這篇文章從日常系統操作出發,帶你看見那些「先這樣跑就好」背後的長期代價。看不見的債,總在你最忙的時候來討。
Thumbnail
2025/05/03
當 AI 不再只是提供選項,而是開始幫你規劃旅程、比價、下訂時,我們也正邁向一種全新的旅行方式。這篇文章從「AI 幫你訂房」的現象出發,帶你理解什麼是代理型 AI,以及它如何改變未來旅遊產業的角色與服務邏輯。
Thumbnail
2025/05/03
當 AI 不再只是提供選項,而是開始幫你規劃旅程、比價、下訂時,我們也正邁向一種全新的旅行方式。這篇文章從「AI 幫你訂房」的現象出發,帶你理解什麼是代理型 AI,以及它如何改變未來旅遊產業的角色與服務邏輯。
Thumbnail
2025/05/01
當你還在掃條碼結帳、停紅線自以為神不知鬼不覺時,AI 模型 YOLO 早就在監視器後默默圈出你的一舉一動。從超商結帳到 Amazon Go,從路邊違停到工廠品檢,YOLO 正改寫我們的日常。它不是在創作,而是在「一眼看穿你在幹嘛」。
Thumbnail
2025/05/01
當你還在掃條碼結帳、停紅線自以為神不知鬼不覺時,AI 模型 YOLO 早就在監視器後默默圈出你的一舉一動。從超商結帳到 Amazon Go,從路邊違停到工廠品檢,YOLO 正改寫我們的日常。它不是在創作,而是在「一眼看穿你在幹嘛」。
Thumbnail
看更多
你可能也想看
Thumbnail
生產力爆發帶來的過剩,會讓過去的「還可以啦」成為最低標準。市場需求對於出類拔萃、獨一無二的需求還是存在,但是對於那些價格高度敏感,或是只需要穩定、便宜、還可以啦的需求端來說,AI 正在迅速取代這部分的供給,中間長尾的服務提供者被 AI 替換。
Thumbnail
生產力爆發帶來的過剩,會讓過去的「還可以啦」成為最低標準。市場需求對於出類拔萃、獨一無二的需求還是存在,但是對於那些價格高度敏感,或是只需要穩定、便宜、還可以啦的需求端來說,AI 正在迅速取代這部分的供給,中間長尾的服務提供者被 AI 替換。
Thumbnail
今年在 Google I/O 有幸看到 Hassabis 本人幾秒,DeepMind 和共同創辦人 Demis Hassabis 的這個題目,也一直都在待寫清單中。 前陣子,在介紹 Founders Fund 時,發現 Demis Hassabis 當初在說服 Peter Thiel 投資 Dee
Thumbnail
今年在 Google I/O 有幸看到 Hassabis 本人幾秒,DeepMind 和共同創辦人 Demis Hassabis 的這個題目,也一直都在待寫清單中。 前陣子,在介紹 Founders Fund 時,發現 Demis Hassabis 當初在說服 Peter Thiel 投資 Dee
Thumbnail
反省就是重寫自己的演算法吧? 假設我就是人工智慧,或心智的可以被看作爲人工智慧的編輯器,那我的程式碼是什麼樣的? 從懵懂無知到一無所知,從自以為是到自我消逝,心智只是執行它的內容,我也需要不斷優化。 最好的優化就是簡化。 最能創造財富的演算法就是關於如何除錯與減少任何風險。
Thumbnail
反省就是重寫自己的演算法吧? 假設我就是人工智慧,或心智的可以被看作爲人工智慧的編輯器,那我的程式碼是什麼樣的? 從懵懂無知到一無所知,從自以為是到自我消逝,心智只是執行它的內容,我也需要不斷優化。 最好的優化就是簡化。 最能創造財富的演算法就是關於如何除錯與減少任何風險。
Thumbnail
生成式AI與以創意為生的「廣告人」,有可能和平共處嗎?使用AI工具幫客戶做行銷企畫,會不會有「偷吃步」的嫌疑?
Thumbnail
生成式AI與以創意為生的「廣告人」,有可能和平共處嗎?使用AI工具幫客戶做行銷企畫,會不會有「偷吃步」的嫌疑?
Thumbnail
產品採購:AI 可以幫助找到熱門的產品和趨勢。 客戶互動:AI 可以自動回答客戶問題,提供個性化的產品推薦。 市場分析:AI 可以自動分析市場數據,幫助你了解競爭對手和市場趨勢。 產品描述寫作:AI 可以自動生成產品描述,節省你的時間。
Thumbnail
產品採購:AI 可以幫助找到熱門的產品和趨勢。 客戶互動:AI 可以自動回答客戶問題,提供個性化的產品推薦。 市場分析:AI 可以自動分析市場數據,幫助你了解競爭對手和市場趨勢。 產品描述寫作:AI 可以自動生成產品描述,節省你的時間。
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
Thumbnail
本篇文章就來分享幾個業界午餐會中聊到的賦能案例與思考。
Thumbnail
本篇文章就來分享幾個業界午餐會中聊到的賦能案例與思考。
Thumbnail
⋯⋯不過,我所抱持的心態,並不是透過提示來獲得答案,而是透過提示來獲得通往最終答案的靈感或啟發。——《高產出的本事》劉奕酉
Thumbnail
⋯⋯不過,我所抱持的心態,並不是透過提示來獲得答案,而是透過提示來獲得通往最終答案的靈感或啟發。——《高產出的本事》劉奕酉
Thumbnail
這一篇文章是我投稿至第83屆AOM國際研討會(Academy of Management)中文版手稿的節錄版本,我將其中比較理論面的部分刪減,把能實務應用的部分進行說明,希望能方便大家閱讀以理解在AI時代,企業面對的知識管理與獨特性競爭策略的議題。 這篇文章獲得 AOM 國際研討會(國科會認可的
Thumbnail
這一篇文章是我投稿至第83屆AOM國際研討會(Academy of Management)中文版手稿的節錄版本,我將其中比較理論面的部分刪減,把能實務應用的部分進行說明,希望能方便大家閱讀以理解在AI時代,企業面對的知識管理與獨特性競爭策略的議題。 這篇文章獲得 AOM 國際研討會(國科會認可的
Thumbnail
本文會利用sklearn引入breast_cancer datasets來訓練,在處理數據的部份,特徵工程用兩種方式去做處理,分別是特徵選取與特徵萃取的方式去做比較。 特徵選取的方法中,使用了KNN 分類器來選出最重要的兩個特徵 特徵萃取的方法中,使用了PCA降維
Thumbnail
本文會利用sklearn引入breast_cancer datasets來訓練,在處理數據的部份,特徵工程用兩種方式去做處理,分別是特徵選取與特徵萃取的方式去做比較。 特徵選取的方法中,使用了KNN 分類器來選出最重要的兩個特徵 特徵萃取的方法中,使用了PCA降維
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News