
前一篇已經用 羅吉斯迴歸(Logistic Regression) 建立「分類=算機率👉再做決策」的基本概念。
這一篇,我們把視角拉開,看看在同樣是分類問題時,機器學習裡還有哪些常被拿來比較、替代、甚至混用的模型。
一、K 最近鄰(K-Nearest Neighbors, KNN)
核心思路(好記的一句話)
「跟誰最像,就跟誰一組」
或者
👉「近朱者赤,近墨者黑」
模型特點
- 最直覺,直接計算距離
- 依照樣本(每筆資料)計算彼此的「距離」,找出最近的 K 個樣本
- 用多數決(分類)或平均(迴歸)決定結果
例如:
紅色星星代表未知類別的新資料
K = 3,代表要找最近的 3 個樣本
3 個樣本裡:分類0 有 0 個 / 分類1 有 3 個
投票結果:分類1 獲勝🎉















