
資料有沒有答案,決定了 AI 怎麼學
👉 從分類、迴歸、分群,看懂監督式與非監督式學習。
前言|你是在「教 AI」,還是「讓 AI 自己看」?
想像兩個學習場景。
第一個場景,是考試。
每個題目都有標準答案,老師會告訴你哪一題對、哪一題錯,你只要不斷修正,就會越來越接近正確解法。
第二個場景,沒有考卷也沒有答案。
你只是拿到一堆資料,必須靠自己觀察: 哪些東西看起來相似?哪些又明顯不一樣?
AI 的學習,其實也是在這兩種情境之間做選擇。
一個關鍵問題:資料裡「有沒有答案」?
在前幾篇文章中,我們已經談過三件事:
- 分類 (Classification):判斷屬於哪一類
- 迴歸 (Regression):預測一個數值
- 分群 (Clustering):找出資料自然形成的群體
如果仔細觀察,這三種分析方法主要的差別是:
1. 資料有答案 vs 資料沒有答案
2. 答案是離散性的值 vs 答案是連續性的數字
然而,
到目前為止,我們其實都還停留在一個層次:
「怎麼依照資料與答案的型態,選擇合適的分析方式?」
分類、迴歸、分群,本身並不是完整的技術體系,
而是用來描述「問題結構」的基本方法。
但在真實世界中,我們關心的從來不只是方法名稱,
而是: 👉 AI 是如何從資料中學會這些規則的?
當我們開始追問這個問題時,就必須正式進入一個更核心的層次——
機器學習(Machine Learning, ML)。
機器學習並不是某一種模型,
而是一整套讓 AI 能夠「從資料中學習、修正、泛化」的技術框架。 之前提到的分類、迴歸、分群, 正是在這個框架之下,被系統化整理出來的學習方式。

在 AI 的整個技術版圖中,
機器學習(Machine Learning, ML)扮演的角色是: 把「資料」轉換成「可重複使用的判斷規則」。
不論是預測數值、判斷類別,或探索資料結構,
機器學習關心的從來不是一次性的結果, 而是這些結果是否能在新資料上持續成立。
以下介紹二種核心架構:
一、監督式學習(Supervised Learning):先告訴 AI 正確答案
從機器學習的角度來看,監督式學習(Supervised Learning)的核心特徵可以濃縮成一句話:
📌資料本身就帶著正確答案,AI 的任務是學會如何對照。
如果資料長這樣:
- 這封信是不是垃圾郵件?(是 / 否)
- 這間房子值多少錢?(實際成交價)
- 這個人會不會違約?(會 / 不會)
那麼,之前介紹的:
- 分類(Classification)
- 迴歸(Regression)
本質上都屬於這一類。
他們各自會依理論角度不同再延伸模型,例如:
- Logistic Regression(邏輯斯迴歸)
- Decision Tree(決策樹)
- SVM
- Neural Network(神經網路)
現在不需要急著理解它們怎麼運算。
只需知道一件事:
它們做的事情其實一樣——拿「有答案的資料」來學規則。
差別,只在學得好不好、穩不穩定、適不適合你的資料。
二、非監督式學習(Unsupervised Learning):沒有答案,只能先看結構
那如果資料長這樣呢?
- 一群顧客的消費紀錄,沒有標註類型
- 一堆使用者行為資料,不知道誰是誰
- 一堆特徵,但沒有「對 / 錯」可對照
這時候,根本無法要求 AI「預測答案」,
📌因為——答案根本不存在。
這類情境,就是非監督式學習(Unsupervised Learning)。
它的核心任務不是預測,而是:
- 找出資料的結構
- 看哪些資料彼此相似
- 協助人類「先理解資料長什麼樣子」
從機器學習的角度來看,
非監督式學習並不是用來產生答案, 而是用來建立對資料結構的理解基礎。
先前介紹的:
- 分群(Clustering)
就是最典型的例子。
他也延伸了許多好用的模型,像是:
- K-means
- Hierarchical Clustering
- PCA(用來濃縮資料重點)
同樣只需要記住一句話:
非監督式學習沒有準不準,
而是它只能嘗試從資料中找出穩定、可解釋的結構。
也正因如此,非監督式學習通常不是決策的終點,而是理解問題的起點。
從學習方式,走向第一個模型
到這裡為止,我們已經把一件事釐清得很清楚:
在機器學習中,真正的第一步不是選模型,而是確認《學習方式》。
一旦問題被界定為「監督式學習」,
接下來才會出現一個更實際、也更常被問到的問題:
👉 那第一個該認識的模型,是哪一個?
在眾多監督式模型中,
有兩個名字幾乎一定會最先出現—— 線性迴歸(Linear Regression) 與 邏輯斯迴歸(Logistic Regression)。
它們之所以重要,並不是因為計算多複雜,
而是因為它們清楚展示了: 機器學習是如何把資料,轉換成可解釋的判斷規則。
下一篇,我會從這兩個模型之一開始,
不談推導、不進數學, 只專注在一件事上: 它在解決什麼問題?為什麼會成為監督式學習的起點?
課程說明
🔖 以下內容為本系列的學習安排與閱讀指引。
- 為方便大家學習,我將全部章節進行劃分,詳見導覽文。
- 同時,每當完成某一主題介紹時,我也會在圖上「插旗」,讓學習者明白自己的進度。
- 目前會以名詞介紹為主,後續會進行模型細節的探討,儘量趕在2026年3月中旬完成。
- 若需要先介紹某一主題時,請先留言,我會儘量配合。

















