前言:
在學習 機器學習 和 AI 的過程中,我們會接觸到許多不同的算法,而其中有三個算法經常會讓人混淆,它們分別是 決策樹(Decision Tree)、支持向量機(SVM) 和 K-means。雖然它們都用來處理資料,但每一個算法的應用場景和運作方式都有所不同。為了讓大家更容易理解這三個算法,這篇文章將用簡單的例子來解釋每個算法的分析原理、性質,並且幫助大家進一步了解它們在AI系統中的運作,無論是在學習過程中還是準備考試時,這些例子都能幫助你更快速地掌握這些概念。
1. 決策樹(Decision Tree)
- 分析原理:決策樹是從大範圍的資料開始,根據每個特徵逐步提問來進行分類,最終將資料歸類到特定的類別。每個節點是根據特徵來分支,直到資料點被分配到葉子節點。
- 性質:分類
- 原因:決策樹通過對資料進行分支,最終將資料分類成不同的類別。
- 冰淇淋的例子:
- 決策樹會先問:「天氣是否炎熱?」如果答案是「是」,接著會問:「顧客年齡是否在18歲以上?」如果答案是「是」,那麼預測顧客會購買冰淇淋。
2. 支持向量機(SVM)
- 分析原理:支持向量機是基於資料的特徵,尋找最佳的分界線,將資料分為兩類,像是在二維空間中進行聚焦,最大化兩類之間的距離來提升分類精確度。
- 性質:分類
- 原因:SVM 將資料點分類為兩類,並找到最佳分界線來最大化分類的準確性。
- 冰淇淋的例子:
- 支持向量機會根據顧客的年齡和天氣來畫出一條分界線,顧客年齡小於35歲且天氣炎熱的顧客會被劃分為「會購買冰淇淋」的一類,年齡大且天氣涼爽的顧客會被劃分為「不會購買冰淇淋」的另一類。
3. K-means
- 分析原理:K-means 是從大範圍的資料開始,根據資料的相似性將資料自動分為幾個群組。每個群組的資料點內部相似性高,群組間的資料點差異大,直到群組分配不再改變。
- 性質:分群
- 原因:K-means 用來將資料分成幾個群組,並依據顧客的相似性來自動分組。
- 冰淇淋的例子:
- K-means 會將顧客根據年齡和購買冰淇淋的時間(如夏天購買)自動分為兩個群組:
- 年輕顧客群(例如25歲以下的顧客,並且夏天購買冰淇淋的顧客會放一組),
- 年長顧客群(例如年齡較大的顧客,可能會放在另一組,並且依然會購買冰淇淋)。
- 接著,K-means會根據顧客特徵再次調整群組的邊界,逐步內縮,直到群組穩定不變,每個群體的顧客特徵更加相似。
總結彙整:
