41/100 K-Means 聚類 🎯 把資料分成 K 組,適用於客戶分群與圖像壓縮!

更新於 發佈於 閱讀時間約 6 分鐘

AI時代系列(1) 機器學習三部曲: 🔹 第一部:《機器學習 —— AI 智慧的啟航》


41/100 第五週:非監督學習


41. K-Means 聚類 🎯 把資料分成 K 組,適用於客戶分群與圖像壓縮!


K-Means 聚類 🎯

核心概念:沒有標籤,AI 自己找出資料的結構與分群規律!

________________________________________


✅ 什麼是 K-Means 聚類?


K-Means 是最經典、最常用的非監督學習演算法之一。


目標是把資料自動分成 K 個群組(Cluster),讓同一群內的資料彼此相似,不同群之間差異大。


📌 關鍵應用場景:


客戶分群(Customer Segmentation)

圖像壓縮(Image Compression)

市場分析(Market Segmentation)

社群偵測(Social Network Analysis)

________________________________________


✅ K-Means 演算法流程(核心步驟)


1️⃣ 決定 K 值(分幾群)

2️⃣ 隨機選出 K 個初始中心點(Centroids)

3️⃣ 分群:每筆資料指派到最近的中心點形成群組

4️⃣ 更新:重新計算每一群的中心點

5️⃣ 重複步驟 3 和 4,直到中心點不再改變(收斂)

________________________________________


✅ 數學公式概念


目標是最小化所有點到其所屬中心點的距離平方和(WCSS:Within-Cluster Sum of Square):


✨ 白話說明:


K-means 就是在反覆調整每一個群中心的位置,讓:


每個資料點離自己的「中心點」越近越好(平方距離越小)


最後所有這些距離的總和是最小的


________________________________________


✅ K-Means 優點與缺點


✅ 優點


計算速度快,容易理解與實作

適合大量數據(Big Data)

適合資料型態明確的分群


⚠ 缺點


對初始中心點敏感,可能陷入局部最佳解

需事先決定 K 值

對離群值(Outliers)敏感

________________________________________


✅ Python 範例實作


python


import numpy as np

import matplotlib.pyplot as plt

from sklearn.cluster import KMeans

from sklearn.datasets import make_blobs


# 產生模擬數據

X, _ = make_blobs(n_samples=300, centers=4, cluster_std=0.6, random_state=42)


# 建立 K-Means 模型(假設分 4 群)

kmeans = KMeans(n_clusters=4, random_state=42)

kmeans.fit(X)

y_kmeans = kmeans.predict(X)


# 視覺化結果

plt.scatter(X[:, 0], X[:, 1], c=y_kmeans, cmap='viridis')

plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], s=200, c='red', marker='X')

plt.title("K-Means 聚類結果")

plt.show()

________________________________________


✅ K 值怎麼選?(Elbow Method)


計算不同 K 值下的 WCSS

畫出「肘部圖(Elbow Curve)」

找到「彎曲點」作為最佳 K 值(平衡分群效果與模型簡單度)

________________________________________


✅ 應用案例延伸


銀行客戶分群 → 找出高價值客群

電子商務推薦 → 相似客戶推相似商品

圖像壓縮 → 用 K 個顏色代表整張圖,降低檔案大小

市場區隔策略設計

________________________________________


✅ 總結重點:


💡 K-Means 聚類 = 自動分群好幫手,讓 AI 幫你找到隱藏的群體結構!

📌 適合用於 客戶分群、圖像壓縮、行為分析 等場景

📌 重點在選對 K 值,避免過度分群或分群不足

________________________________________


如果你想知道:


✅ 如何評估 K-Means 分群效果(Silhouette Score)

✅ Mini-Batch K-Means 處理大數據集範例

✅ K-Means++ 初始值改進方法


都可以告訴我,我完整補上!


留言
avatar-img
留言分享你的想法!
avatar-img
Hansen W的沙龍
3會員
106內容數
AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台,主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例,更強調理性思維與行動力的結合。無論你是AI初學者、創業者,還是追求人生升維的行者,都能在這裡找到前進的方向與志同道合的夥伴。
Hansen W的沙龍的其他內容
2025/05/28
分類評估不只看準確率,依任務重點選擇精準率、召回率、F1 或 ROC-AUC:詐欺偵測求精準,癌症篩檢重召回,不平衡資料看 AUC,F1 兼顧兩者;掌握指標特性,才能對模型調參、比較與落地部署,記住:指標選錯,決策也會錯!
Thumbnail
2025/05/28
分類評估不只看準確率,依任務重點選擇精準率、召回率、F1 或 ROC-AUC:詐欺偵測求精準,癌症篩檢重召回,不平衡資料看 AUC,F1 兼顧兩者;掌握指標特性,才能對模型調參、比較與落地部署,記住:指標選錯,決策也會錯!
Thumbnail
2025/05/28
多類別分類面對標籤 > 2 的任務,常用 One-vs-All :將問題拆成 N 個二分類器,各自判斷「是否為第 i 類」。此法概念直觀、能平行訓練,並與 SVM、邏輯回歸等二分類模型相容,適合資源有限又需快速上線的應用,但要留意一旦某類難分,可能拖累整體表現。
Thumbnail
2025/05/28
多類別分類面對標籤 > 2 的任務,常用 One-vs-All :將問題拆成 N 個二分類器,各自判斷「是否為第 i 類」。此法概念直觀、能平行訓練,並與 SVM、邏輯回歸等二分類模型相容,適合資源有限又需快速上線的應用,但要留意一旦某類難分,可能拖累整體表現。
Thumbnail
2025/05/28
本篇深入解析神經網路中的多層感知機(MLP),帶你掌握其在圖片、文字、語音分類等非線性任務中的強大能力。搭配 sklearn 實作手寫數字辨識,從架構、激活函數到優缺點一次搞懂,適合想進階 AI 模型應用的學習者,是踏入深度學習的絕佳起點!
Thumbnail
2025/05/28
本篇深入解析神經網路中的多層感知機(MLP),帶你掌握其在圖片、文字、語音分類等非線性任務中的強大能力。搭配 sklearn 實作手寫數字辨識,從架構、激活函數到優缺點一次搞懂,適合想進階 AI 模型應用的學習者,是踏入深度學習的絕佳起點!
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
AI與人類分工:預測與判斷的智慧結合
Thumbnail
AI與人類分工:預測與判斷的智慧結合
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
誠品生活|科技應用 書櫃陳列著與AI相關軟硬體的科技應用實作材料包,包含物聯網、影像辨識、機器學習、生醫感測等實作套裝材料。 選擇趨勢|科技玩物 這麼多科技應用實作包,怎麼選呢? 科技日新月異 科技玩物在生活中反應的特徵詞: 顛覆、科幻、新奇、便利、酷炫、魔法、未來
Thumbnail
誠品生活|科技應用 書櫃陳列著與AI相關軟硬體的科技應用實作材料包,包含物聯網、影像辨識、機器學習、生醫感測等實作套裝材料。 選擇趨勢|科技玩物 這麼多科技應用實作包,怎麼選呢? 科技日新月異 科技玩物在生活中反應的特徵詞: 顛覆、科幻、新奇、便利、酷炫、魔法、未來
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
Thumbnail
這一篇文章是我投稿至第83屆AOM國際研討會(Academy of Management)中文版手稿的節錄版本,我將其中比較理論面的部分刪減,把能實務應用的部分進行說明,希望能方便大家閱讀以理解在AI時代,企業面對的知識管理與獨特性競爭策略的議題。 這篇文章獲得 AOM 國際研討會(國科會認可的
Thumbnail
這一篇文章是我投稿至第83屆AOM國際研討會(Academy of Management)中文版手稿的節錄版本,我將其中比較理論面的部分刪減,把能實務應用的部分進行說明,希望能方便大家閱讀以理解在AI時代,企業面對的知識管理與獨特性競爭策略的議題。 這篇文章獲得 AOM 國際研討會(國科會認可的
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News