
前言|當「答案不存在」,學習還成立嗎?
學過 監督式學習(Supervised Learning)後,我們知道:不管是迴歸還是分類,它們的資料都有答案,模型可以從中學習規則。
如果把「監督式學習」比喻成在學校上課,老師會拿著一張張圖片告訴你:「這是貓、這是狗」,然後考試時讓你分辨哪張是貓;那麼「非監督式學習」就像是把你丟到一個陌生的星球,沒有人告訴你眼前看到的東西叫什麼,你必須自己去觀察、摸索,找出它們的規律。

我們把這種情況拆解成三個最直觀的「超能力」來理解:
📌自動分組(物以類聚)
找出 相似性(Similarity),這是非監督式學習最常見的能力,專業上稱為「聚類」。
• 情境: 想像在星球上看到的一堆生物,你不認識它們,也不知道它們該叫什麼。
• 它怎麼做: 雖然不知道名字,但可以根據「腳」、「翅膀」、「走路方式」這些特徵,把長得像的歸為一起。
• 範例: 系統可以用這種方式幫企業把成千上萬的客戶自動分成「愛買便宜貨的」、「只買高檔貨的」或「很久沒來的」幾群人,方便老闆針對不同客群做生意。
📌發現隱藏關係(買了A 通常也會買B)
這就是著名的「購物籃分析」。
• 情境: 就像一位觀察力敏銳的店長,盯著大家結帳的購物籃看。
• 它怎麼做: 它不看你是誰,只看大家「一起買了什麼」。它可能會發現一個奇怪的規律:「星期五晚上買尿布的男生,通常也會順便買啤酒」。這不是因為這兩樣東西有什麼物理關係,而是數據顯示它們經常同時出現。
• 範例: 常見購物網站,當選購某些商品時,系統會跳出「買了這本書的人,也買了那本書」的推薦功能。
📌抓重點、化繁為簡(把複雜變簡單)
這對應到專業術語中的「降維」。
• 情境: 想像你要向朋友介紹一位新認識的人,你手上有他的身高、體重、髮型、鞋號、血型、星座等100項資料。
• 它怎麼做: 你不會把100項資料全唸出來,因為太囉唆了。你會自動過濾掉不重要的資訊,只挑出 「溫柔親切」或「高富帥」這些最能代表他特徵的重點。這就是在保留關鍵資訊的同時,把複雜的資料變簡單。
• 範例: 當資料量太大、太複雜時(例如一張超高畫質的照片),電腦可以用這招把它「壓縮」成幾條簡單的線條或特徵,但還是認得出那是誰。
「非監督式學習」最常用在哪些地方?
⚠️ 需要注意一點
非監督式學習的目的,不是預測結果,也不是給出標準答案。
它無法告訴你「對或錯」,
只能幫你回答:「資料大概長什麼樣子?」
在實務與考試中,它最常出現在三個地方:
- 🎯 資料探索(Exploratory Analysis)
- 🎯 前處理與特徵理解
- 🎯 輔助決策與策略分群
換句話說:
當問題還沒定義清楚時,
非監督式學習,往往是第一個登場的工具。
小結
非監督式學習就是讓電腦去「自己找規律」。 它不需要你事先辛苦地標記答案(不用告訴它這是貓、那是狗),它會自己透過觀察大量的資料,得到:「這群資料長得很像(分組)」、「這兩個東西常一起出現(關聯)」或是「這堆資料的重點其實只有這幾個(簡化)」。
先前的文章曾介紹的《分群 Clustering》就屬於非監督式學習的技術。
目前很紅的 ChatGPT 或其他 AI,其實很多基礎也是來自於這種「自學」的概念(例如讀了網路上無數的文章,自己學會了哪個字後面通常會接哪個字,就像玩填空遊戲一樣),這也是非監督式學習的一種延伸應用。
📌非監督式學習:
沒有標籤、不談準確率,用來理解資料結構,而不是做最終判斷。
🚀 這一句 對 AI-900 / AI 應用初級都超好用。
👉下一篇:非監督式學習模型介紹
課程說明
🔖 以下內容為本系列的學習安排與閱讀指引。
- 為方便大家學習,我將全部章節進行劃分,詳見導覽文。
- 本系列文章區分為「免費文」與「收費文」,
目的在於清楚分開「初步認識」與「深入理解」兩個學習階段。
收費內容將在基礎概念之上,整合重點圖表與說明,並融入個人教學與應考經驗,
協助讀者建立可實際運用的理解框架。 - 各系列的收費文章皆以「考試情境」為主軸進行整理,
不僅補齊必要的模型原理與判斷邏輯,
亦會搭配模擬題與選項解析,
協助學習者從「看懂內容」,進一步轉化為「選得正確」。







