41/100 K-Means 聚類 🎯 把資料分成 K 組，適用於客戶分群與圖像壓縮！

Hansen W

發佈於AI科技機器學習修煉坊

2025/05/28 更新2025/05/28 發佈閱讀 6 分鐘

AI時代系列(1) 機器學習三部曲: 🔹 第一部：《機器學習 —— AI 智慧的啟航》

41/100 第五週：非監督學習

41. K-Means 聚類 🎯 把資料分成 K 組，適用於客戶分群與圖像壓縮！

K-Means 聚類 🎯

核心概念：沒有標籤，AI 自己找出資料的結構與分群規律！

________________________________________

✅ 什麼是 K-Means 聚類？

K-Means 是最經典、最常用的非監督學習演算法之一。

目標是把資料自動分成 K 個群組（Cluster），讓同一群內的資料彼此相似，不同群之間差異大。

📌 關鍵應用場景：

• 客戶分群（Customer Segmentation）

• 圖像壓縮（Image Compression）

• 市場分析（Market Segmentation）

• 社群偵測（Social Network Analysis）

________________________________________

✅ K-Means 演算法流程（核心步驟）

1️⃣ 決定 K 值（分幾群）

2️⃣ 隨機選出 K 個初始中心點（Centroids）

3️⃣ 分群：每筆資料指派到最近的中心點形成群組

4️⃣ 更新：重新計算每一群的中心點

5️⃣ 重複步驟 3 和 4，直到中心點不再改變（收斂）

________________________________________

✅ 數學公式概念

目標是最小化所有點到其所屬中心點的距離平方和（WCSS：Within-Cluster Sum of Square）：

✨ 白話說明：

K-means 就是在反覆調整每一個群中心的位置，讓：

每個資料點離自己的「中心點」越近越好（平方距離越小）

最後所有這些距離的總和是最小的

________________________________________

✅ K-Means 優點與缺點

✅ 優點

計算速度快，容易理解與實作

適合大量數據（Big Data）

適合資料型態明確的分群

⚠ 缺點

對初始中心點敏感，可能陷入局部最佳解

需事先決定 K 值

對離群值（Outliers）敏感

________________________________________

✅ Python 範例實作

python

import numpy as np

import matplotlib.pyplot as plt

from sklearn.cluster import KMeans

from sklearn.datasets import make_blobs

# 產生模擬數據

X, _ = make_blobs(n_samples=300, centers=4, cluster_std=0.6, random_state=42)

# 建立 K-Means 模型（假設分 4 群）

kmeans = KMeans(n_clusters=4, random_state=42)

kmeans.fit(X)

y_kmeans = kmeans.predict(X)

# 視覺化結果

plt.scatter(X[:, 0], X[:, 1], c=y_kmeans, cmap='viridis')

plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], s=200, c='red', marker='X')

plt.title("K-Means 聚類結果")

plt.show()

________________________________________

✅ K 值怎麼選？（Elbow Method）

• 計算不同 K 值下的 WCSS

• 畫出「肘部圖（Elbow Curve）」

• 找到「彎曲點」作為最佳 K 值（平衡分群效果與模型簡單度）

________________________________________

✅ 應用案例延伸

• 銀行客戶分群 → 找出高價值客群

• 電子商務推薦 → 相似客戶推相似商品

• 圖像壓縮 → 用 K 個顏色代表整張圖，降低檔案大小

• 市場區隔策略設計

________________________________________

✅ 總結重點：

💡 K-Means 聚類 = 自動分群好幫手，讓 AI 幫你找到隱藏的群體結構！

📌 適合用於客戶分群、圖像壓縮、行為分析等場景

📌 重點在選對 K 值，避免過度分群或分群不足

________________________________________

如果你想知道：

✅ 如何評估 K-Means 分群效果（Silhouette Score）

✅ Mini-Batch K-Means 處理大數據集範例

✅ K-Means++ 初始值改進方法

都可以告訴我，我完整補上！

Hansen W的沙龍AI科技機器學習修煉坊

留言

留言分享你的想法！

Hansen W的沙龍

17會員

510內容數

AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台，主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例，更強調理性思維與行動力的結合。無論你是AI初學者、創業者，還是追求人生升維的行者，都能在這裡找到前進的方向與志同道合的夥伴。

Hansen W的沙龍的其他內容

2025/05/28

40/100 評估分類模型（Precision, Recall, F1-score, ROC-AUC） 🎯 不同的指標

分類評估不只看準確率，依任務重點選擇精準率、召回率、F1 或 ROC-AUC：詐欺偵測求精準，癌症篩檢重召回，不平衡資料看 AUC，F1 兼顧兩者；掌握指標特性，才能對模型調參、比較與落地部署，記住：指標選錯，決策也會錯！

2025/05/28

40/100 評估分類模型（Precision, Recall, F1-score, ROC-AUC） 🎯 不同的指標

2025/05/28

39/100 多類別分類與 One-vs-All 技術 🎨 當類別多於兩種時，如何拆解分類問題？

多類別分類面對標籤 > 2 的任務，常用 One-vs-All ：將問題拆成 N 個二分類器，各自判斷「是否為第 i 類」。此法概念直觀、能平行訓練，並與 SVM、邏輯回歸等二分類模型相容，適合資源有限又需快速上線的應用，但要留意一旦某類難分，可能拖累整體表現。

2025/05/28

39/100 多類別分類與 One-vs-All 技術 🎨 當類別多於兩種時，如何拆解分類問題？

2025/05/28

38/100 神經網路分類（ANN） 🧠 多層感知機（MLP）可以學習複雜模式，提高分類準確率！

本篇深入解析神經網路中的多層感知機（MLP），帶你掌握其在圖片、文字、語音分類等非線性任務中的強大能力。搭配 sklearn 實作手寫數字辨識，從架構、激活函數到優缺點一次搞懂，適合想進階 AI 模型應用的學習者，是踏入深度學習的絕佳起點！

2025/05/28

38/100 神經網路分類（ANN） 🧠 多層感知機（MLP）可以學習複雜模式，提高分類準確率！

看更多

你可能也想看

哈斯的煉金工房

蝦皮購物11/11攻略：掌握領券、搶購、分潤三大關鍵，輕鬆放大你的荷包！

身為採購專家，當然不能錯過11/11購物節的超殺折扣！本文將帶你深入瞭解蝦皮11/11購物節的完整攻略，從必領的各種優惠券、商城折扣，到限時的搶購技巧，讓你買到手軟荷包也不哭泣。更重要的是，揭密蝦皮分潤計畫，教你如何零成本創業，透過分享商品連結，每月輕鬆加薪，開啟數位遊牧人生！

#蝦皮購物#蝦皮#購物節

2025/11/06

哈斯的煉金工房

蝦皮購物11/11攻略：掌握領券、搶購、分潤三大關鍵，輕鬆放大你的荷包！

#蝦皮購物#蝦皮#購物節

2025/11/06

寄放靈魂的閣樓

喜迎雙11購物節！加入蝦皮分潤計畫，輕鬆跨海購買心儀商品

雙11購物節將近，這次分享一些蝦皮海外賣場購物的步驟與注意事項，並且介紹雙11蝦皮購物的相關優惠；另外蝦皮分潤計畫持續招募新血中，只要分享購物連結即可獲得分潤，是很適合創作者的額外收入管道喔！

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

寄放靈魂的閣樓

喜迎雙11購物節！加入蝦皮分潤計畫，輕鬆跨海購買心儀商品

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

本文要探討AI的任務與實戰場景。AI技術已深入生活各層面，從違約預測到都市交通管理。AI任務主要有三類：數值型資料處理、自然語言處理（NLP）和電腦影像辨識。時間序列資料和強化學習方法（如AlphaGo）也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化，了解這些基礎有助選擇適合研究方向

#ChatGPT#AlphaGo#人工智慧

2024/07/19

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

#ChatGPT#AlphaGo#人工智慧

2024/07/19

蠢孩子の小說世界

AI 聽你說圖

科技發達，AI智能也越來越發達。蠢孩子，我每篇小說的圖片都是用AI製作的唷!!

#AI繪圖#AI製圖#圖片

2024/07/08

蠢孩子の小說世界

AI 聽你說圖

科技發達，AI智能也越來越發達。蠢孩子，我每篇小說的圖片都是用AI製作的唷!!

#AI繪圖#AI製圖#圖片

2024/07/08

莎姐的矽谷茶棧

你開始使用AI了嗎？

最新的AI趨勢讓人眼花撩亂，不知要如何開始學習？本文介紹了作者對AI的使用和體驗，以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具，可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心，不停止學習，並提出了對健康生活和開心生活的祝福。

2024/06/14

2024/06/14

AI與人類分工：預測與判斷的智慧結合

2024/06/03

AI與人類分工：預測與判斷的智慧結合

2024/06/03

筆記-曲博談AI模型.群聯-24.05.05

筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型三個步驟: 1.預訓練，訓練一次要用幾萬顆處理器、訓練時間要1個月，ChatGPT訓練一次的成本為1000萬美金。 2.微調(

2024/05/06

每日發車

筆記-曲博談AI模型.群聯-24.05.05

2024/05/06

D&Y熊繪生的沙龍

心情繪本｜DALL.E ｜單晶片｜開箱｜[學AI機器學習：不用靠電腦！]

誠品生活｜科技應用書櫃陳列著與AI相關軟硬體的科技應用實作材料包，包含物聯網、影像辨識、機器學習、生醫感測等實作套裝材料。選擇趨勢｜科技玩物這麼多科技應用實作包，怎麼選呢？科技日新月異科技玩物在生活中反應的特徵詞：顛覆、科幻、新奇、便利、酷炫、魔法、未來

#AI#機器學習#ML

2024/03/03

D&Y熊繪生的沙龍

心情繪本｜DALL.E ｜單晶片｜開箱｜[學AI機器學習：不用靠電腦！]

#AI#機器學習#ML

2024/03/03

美國人力資源港 - 九思觀點

何謂「人工智能」？What is AI?

AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域，包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性，還可解決複雜的問題和挑戰。

#人工智能#機器學習#深度學習

2024/02/23