1. K-means(K 平均聚類)
- 主要概念:將資料分為 K 個群組,每群以中心點代表。
- 衍伸概念:初始中心選擇會影響結果、不適合類別資料、不耐離群值。
- 應用情境:客戶分群、市場區隔、推薦系統。
- 口訣:「K群近中心,分群憑距離」(K 群組 → 接近中心 → 算距離)。
2. 布林型(Boolean)
- 主要概念:資料僅能為「是/否、真/假、0/1」的二元格式。
- 衍伸概念:在 AI 預測中常用來分類(如是否購買)、也常做為條件判斷。
- 應用情境:問卷調查選項(是否同意)、事件觸發控制。
- 口訣:「布林兩值,真或假」
3. 標準差(Standard Deviation)
- 主要概念:衡量資料分散程度,愈大代表資料變異性愈高。
- 衍伸概念:常用於品質控制、金融風險分析。
- 應用情境:生產流程穩定度(標準差大代表波動大) 。
- 口訣:「標準差大,變化不穩;差小,數據穩定」
4. 決策樹(Decision Tree)
- 主要概念:類似邏輯流程圖,由「條件判斷 → 結果分類」組成。
- 衍伸概念:白盒模型、易解釋、易過擬合(可用隨機森林修正)。
- 應用情境:醫療分類、銀行放款風險。
- 口訣:「一路問到底,分支做決策」
5. 線性回歸(Linear Regression)
- 主要概念:預測連續變數,建模公式為 y = ax + b。
- 衍伸概念:可拓展為多元回歸、加入正則化形成 Ridge/Lasso。
- 應用情境:房價預測、銷售趨勢預估 。
- 口訣:「線性線,預測連」(連續變數用線性)
6. DBSCAN(基於密度之含噪空間聚類法)
- 主要概念:不需預先指定群數,根據密度與鄰近距離分群。
- 衍伸概念:可發現任意形狀群集,能辨識離群點。
- 應用情境:地圖群聚分析、社群偵測。
- 口訣:「密集才成群,疏遠變孤兒」
假設你要找出操場上「在聊天的人群」,
- 有人站得很近 → 是一群(朋友在聊天)
- 有人站超遠 → 可能只是路過
- 有人一個人蹲在角落 → 他是孤單的人,不屬於任何群體
這種「看距離、看密度」來分群的方法 → 就叫 DBSCAN
DBSCAN 的三大特點:- 不用指定幾群
- 能處理不規則形狀的群體
- 會自動識別孤立的資料(離群點)
7. 皮爾森積差相關(Pearson Correlation)
- 主要概念:衡量兩個變數間的線性相關程度(-1~1)。
- 衍伸概念:只適用數值變數、只抓線性非因果。
- 應用情境:年齡與薪資正相關、溫度與電費負相關。
- 口訣:「皮爾森拉線,正正負負看」
8. 主成分分析(PCA)
- 主要概念:將高維度資料轉成低維度,保留最大資訊量。
- 衍伸概念:屬資料降維技術、提高視覺化與運算效率。
- 應用情境:影像辨識前處理、基因數據分析。
- 口訣:「降維不減精,資訊換方向」
9. 隨機森林(Random Forest)
- 主要概念:眾多決策樹的集成模型,提升穩定與準確。
- 衍伸概念:可處理分類與回歸問題,降低過擬合。
- 應用情境:詐欺偵測、信用評分。
- 口訣:「森林比一棵強,投票更穩當」
10. 聚類演算法(Clustering)
- 主要概念:將資料依相似性自動分群,無需標籤。
- 衍伸概念:K-means(快但不耐雜訊)、DBSCAN(耐雜訊但需調參)、階層聚類(可視化)
- 應用情境:顧客分群、文件主題分類。
- 口訣:「不知標籤靠相似,自成一群是聚類」
11. 擴散模型(Diffusion Model)
- 主要概念:從純雜訊逐步去雜訊還原資料,常用於圖像生成。
- 衍伸概念:目前已取代 GAN 成為圖像生成主流。
- 應用情境:DALL·E 2、Midjourney 圖像生成 。
- 口訣:「從亂到美,一步一步吹回真相」
12. AR Model(自我回歸模型)
- 主要概念:用過去的自己預測未來值(如 AR(1):Yₜ = aYₜ₋₁ + εₜ)
- 衍伸概念:常與 MA 模型組成 ARIMA 做時序預測。
- 應用情境:股價預測、銷售量走勢。
- 口訣:「過去說未來,自己當輸入」
13. AI 價值擴散(AI Value Diffusion)
- 主要概念:AI 成果需擴展到全組織、多場景、長期維運。
- 衍伸概念:包含部署、監控、優化、知識複製等步驟。
- 應用情境:企業導入客服 AI,逐步擴散至銷售、倉儲部門 。
- 口訣:「上線不是終點,擴散才見效益」



















