決策樹、SVM 與 K-means:深入理解分類與分群算法,冰淇淋行為實例解析

更新於 發佈於 閱讀時間約 3 分鐘

前言

在學習 機器學習AI 的過程中,我們會接觸到許多不同的算法,而其中有三個算法經常會讓人混淆,它們分別是 決策樹(Decision Tree)支持向量機(SVM)K-means。雖然它們都用來處理資料,但每一個算法的應用場景和運作方式都有所不同。為了讓大家更容易理解這三個算法,這篇文章將用簡單的例子來解釋每個算法的分析原理性質,並且幫助大家進一步了解它們在AI系統中的運作,無論是在學習過程中還是準備考試時,這些例子都能幫助你更快速地掌握這些概念。


1. 決策樹(Decision Tree)

  • 分析原理:決策樹是從大範圍的資料開始,根據每個特徵逐步提問來進行分類,最終將資料歸類到特定的類別。每個節點是根據特徵來分支,直到資料點被分配到葉子節點。
  • 性質分類
    • 原因:決策樹通過對資料進行分支,最終將資料分類成不同的類別。
  • 冰淇淋的例子
    • 決策樹會先問:「天氣是否炎熱?」如果答案是「是」,接著會問:「顧客年齡是否在18歲以上?」如果答案是「是」,那麼預測顧客會購買冰淇淋

2. 支持向量機(SVM)

  • 分析原理:支持向量機是基於資料的特徵,尋找最佳的分界線,將資料分為兩類,像是在二維空間中進行聚焦,最大化兩類之間的距離來提升分類精確度。
  • 性質分類
    • 原因:SVM 將資料點分類為兩類,並找到最佳分界線來最大化分類的準確性。
  • 冰淇淋的例子
    • 支持向量機會根據顧客的年齡天氣來畫出一條分界線,顧客年齡小於35歲且天氣炎熱的顧客會被劃分為「會購買冰淇淋」的一類,年齡大且天氣涼爽的顧客會被劃分為「不會購買冰淇淋」的另一類。

3. K-means

  • 分析原理:K-means 是從大範圍的資料開始,根據資料的相似性將資料自動分為幾個群組。每個群組的資料點內部相似性高,群組間的資料點差異大,直到群組分配不再改變。
  • 性質分群
    • 原因:K-means 用來將資料分成幾個群組,並依據顧客的相似性來自動分組。
  • 冰淇淋的例子
    • K-means 會將顧客根據年齡購買冰淇淋的時間(如夏天購買)自動分為兩個群組:
      • 年輕顧客群(例如25歲以下的顧客,並且夏天購買冰淇淋的顧客會放一組),
      • 年長顧客群(例如年齡較大的顧客,可能會放在另一組,並且依然會購買冰淇淋)。
    • 接著,K-means會根據顧客特徵再次調整群組的邊界,逐步內縮,直到群組穩定不變,每個群體的顧客特徵更加相似。

總結彙整:

raw-image



留言
avatar-img
留言分享你的想法!
avatar-img
靈感補給站|隨筆 × 商業 × 創作
0會員
78內容數
📖 財會背景|內部稽核師(CIA)/ERP軟體應用師 上班靠邏輯,下班靠靈感。 寫吃的、寫日常,也寫世界的眉角。 ✨
2025/05/04
技術債不是寫程式才有,它也藏在ERP報表、雲端流程、AI模型裡。這篇文章從日常系統操作出發,帶你看見那些「先這樣跑就好」背後的長期代價。看不見的債,總在你最忙的時候來討。
Thumbnail
2025/05/04
技術債不是寫程式才有,它也藏在ERP報表、雲端流程、AI模型裡。這篇文章從日常系統操作出發,帶你看見那些「先這樣跑就好」背後的長期代價。看不見的債,總在你最忙的時候來討。
Thumbnail
2025/05/03
當 AI 不再只是提供選項,而是開始幫你規劃旅程、比價、下訂時,我們也正邁向一種全新的旅行方式。這篇文章從「AI 幫你訂房」的現象出發,帶你理解什麼是代理型 AI,以及它如何改變未來旅遊產業的角色與服務邏輯。
Thumbnail
2025/05/03
當 AI 不再只是提供選項,而是開始幫你規劃旅程、比價、下訂時,我們也正邁向一種全新的旅行方式。這篇文章從「AI 幫你訂房」的現象出發,帶你理解什麼是代理型 AI,以及它如何改變未來旅遊產業的角色與服務邏輯。
Thumbnail
2025/05/01
當你還在掃條碼結帳、停紅線自以為神不知鬼不覺時,AI 模型 YOLO 早就在監視器後默默圈出你的一舉一動。從超商結帳到 Amazon Go,從路邊違停到工廠品檢,YOLO 正改寫我們的日常。它不是在創作,而是在「一眼看穿你在幹嘛」。
Thumbnail
2025/05/01
當你還在掃條碼結帳、停紅線自以為神不知鬼不覺時,AI 模型 YOLO 早就在監視器後默默圈出你的一舉一動。從超商結帳到 Amazon Go,從路邊違停到工廠品檢,YOLO 正改寫我們的日常。它不是在創作,而是在「一眼看穿你在幹嘛」。
Thumbnail
看更多
你可能也想看
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
反省就是重寫自己的演算法吧? 假設我就是人工智慧,或心智的可以被看作爲人工智慧的編輯器,那我的程式碼是什麼樣的? 從懵懂無知到一無所知,從自以為是到自我消逝,心智只是執行它的內容,我也需要不斷優化。 最好的優化就是簡化。 最能創造財富的演算法就是關於如何除錯與減少任何風險。
Thumbnail
反省就是重寫自己的演算法吧? 假設我就是人工智慧,或心智的可以被看作爲人工智慧的編輯器,那我的程式碼是什麼樣的? 從懵懂無知到一無所知,從自以為是到自我消逝,心智只是執行它的內容,我也需要不斷優化。 最好的優化就是簡化。 最能創造財富的演算法就是關於如何除錯與減少任何風險。
Thumbnail
生成式AI與以創意為生的「廣告人」,有可能和平共處嗎?使用AI工具幫客戶做行銷企畫,會不會有「偷吃步」的嫌疑?
Thumbnail
生成式AI與以創意為生的「廣告人」,有可能和平共處嗎?使用AI工具幫客戶做行銷企畫,會不會有「偷吃步」的嫌疑?
Thumbnail
產品採購:AI 可以幫助找到熱門的產品和趨勢。 客戶互動:AI 可以自動回答客戶問題,提供個性化的產品推薦。 市場分析:AI 可以自動分析市場數據,幫助你了解競爭對手和市場趨勢。 產品描述寫作:AI 可以自動生成產品描述,節省你的時間。
Thumbnail
產品採購:AI 可以幫助找到熱門的產品和趨勢。 客戶互動:AI 可以自動回答客戶問題,提供個性化的產品推薦。 市場分析:AI 可以自動分析市場數據,幫助你了解競爭對手和市場趨勢。 產品描述寫作:AI 可以自動生成產品描述,節省你的時間。
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
Thumbnail
本篇文章就來分享幾個業界午餐會中聊到的賦能案例與思考。
Thumbnail
本篇文章就來分享幾個業界午餐會中聊到的賦能案例與思考。
Thumbnail
⋯⋯不過,我所抱持的心態,並不是透過提示來獲得答案,而是透過提示來獲得通往最終答案的靈感或啟發。——《高產出的本事》劉奕酉
Thumbnail
⋯⋯不過,我所抱持的心態,並不是透過提示來獲得答案,而是透過提示來獲得通往最終答案的靈感或啟發。——《高產出的本事》劉奕酉
Thumbnail
這一篇文章是我投稿至第83屆AOM國際研討會(Academy of Management)中文版手稿的節錄版本,我將其中比較理論面的部分刪減,把能實務應用的部分進行說明,希望能方便大家閱讀以理解在AI時代,企業面對的知識管理與獨特性競爭策略的議題。 這篇文章獲得 AOM 國際研討會(國科會認可的
Thumbnail
這一篇文章是我投稿至第83屆AOM國際研討會(Academy of Management)中文版手稿的節錄版本,我將其中比較理論面的部分刪減,把能實務應用的部分進行說明,希望能方便大家閱讀以理解在AI時代,企業面對的知識管理與獨特性競爭策略的議題。 這篇文章獲得 AOM 國際研討會(國科會認可的
Thumbnail
本文會利用sklearn引入breast_cancer datasets來訓練,在處理數據的部份,特徵工程用兩種方式去做處理,分別是特徵選取與特徵萃取的方式去做比較。 特徵選取的方法中,使用了KNN 分類器來選出最重要的兩個特徵 特徵萃取的方法中,使用了PCA降維
Thumbnail
本文會利用sklearn引入breast_cancer datasets來訓練,在處理數據的部份,特徵工程用兩種方式去做處理,分別是特徵選取與特徵萃取的方式去做比較。 特徵選取的方法中,使用了KNN 分類器來選出最重要的兩個特徵 特徵萃取的方法中,使用了PCA降維
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News