
[場景]
小莉憂愁地看著窗外,她是一間位於辦公大樓區的奶茶店店長,一連 3 天都下著大雨,又遇到連續假日,根本沒有客人,她的營業額受到很大的影響。
她看著手裡的報表,明明先前的營收都不錯啊,每週都有成長的跡象,她還因此多準備一些貨,以防忙碌時遇到沒材料的窘境,結果......
她該怎麼辦?

小莉的算法很簡單:
她以週一到週五為一期,統計賣出的總杯數,扣去成本就是她的淨營收。
她連續記錄 3 個月,營業額呈現小幅上漲的趨勢,她很開心,所以才敢提前備貨。
一、什麼情況適用迴歸?
我們把小莉的情境整理一下:
- 每週一筆資料(週一到週五為 1 筆):
- 特徵(記錄資料):附近大樓有約多少人、購買頻率、高峰時間、氣溫…
- 標籤(答案):這週的淨營收(或總杯數)
- 連續數值要用迴歸:
「營收」不屬於「賺」或「不賺」的類別,而是一個會增或減的數字(連續性的值),所以它屬於迴歸要解決的問題。 - 迴歸的目的不是憑感覺,是讓決策有依據:
它無法保證 100%準確,但它能把「憑感覺備貨」變成「基於資料的估算」,讓小莉至少知道:
- 最差情境大概會掉到哪
- 哪些因素最傷(例如「連假 + 大雨」是雙重暴擊)
二、線性迴歸,是怎麼「套用」在小莉的情況上?
到目前為止,小莉其實已經做了很多店長沒做的事:
她有記錄、有整理,也看得出營收「大致在成長」。
但問題出在這裡——
她看到的是「過去的趨勢」,卻不知道「未來會落在哪裡」。
這正是線性迴歸(Linear Regression)最擅長處理的情境。
1️⃣ 線性迴歸在做的第一件事:先假設「關係是平穩的」
線性迴歸的想法其實非常直觀:
如果營收在一段時間內,是隨著某些條件「慢慢變多或變少」,
那我們可以先假設:
這個變化不是亂跳,而是有一個大致穩定的《 方向 》。
對小莉來說,這個「方向」可能是:
- 時間往後 → 平均營收慢慢上升
- 上班族多 → 營收通常比較好
- 天氣差 → 營收通常下修
線性迴歸做的事情,就是先用一條「最能代表整體趨勢的直線」,把這些資料的變化抓出來。
2️⃣ 為什麼叫「線性」?因為它通常從「最簡單」的關係開始
這裡「線性」的意思是指:資料與資料之間呈現「加/減」的關係,
例如:y = 2x,或者:y = -3x+120
依小莉記錄來看,「最簡單」的關係應該是在:人潮。
有人潮 = 有營收。
例如:
- 上班日,人潮多一點 → 營收平均高一點
- 下雨天,人潮少一點 → 營收平均低一點
這樣的觀察很直覺、也很直接,所以 線性迴歸,常被拿來當「第一個學的預測模型」。
3️⃣ 線性迴歸幫小莉回答的是哪一種問題?
要留意的是:線性迴歸不是在回答這種問題:
「下週一定會賣 3,248 杯嗎?」
它實際上回答的是:
- 在「類似條件」下
- 依照「過去的整體趨勢」
- 下週營收「大概會落在什麼位置」
換句話說,它提供的是一個合理的預期值,而不是保證值。
但對小莉來說,這已經非常關鍵,因為:
- 備貨,不需要抓到剛剛好
- 但不能差到讓成本失控
4️⃣ 為什麼小莉「過去的記錄明明是成長」,結果卻還是踩雷?
小莉原本的判斷,其實只用了時間這個因素:
「這 3 個月都有成長 → 下週應該也不錯吧?」
但線性迴歸在想的會是:
- 成長,是在「什麼條件下」發生的?
- 如果條件改變了(連假 + 大雨),那這條「成長的線」,還能不能直接拿來用?
👉 這也是為什麼:
光看趨勢,和用迴歸模型,是兩個層次的事情。

到這裡,我們已經知道一件事:
不是小莉算錯,
而是她用了一個「太單純的判斷方式」,
去面對一個「條件會變動的世界」。
這樣的情形,不只適用在奶茶店,
也適用在:
✔業績預估
✔人力配置
✔庫存管理
✔甚至企業做 AI 導入評估時的決策
那麼,問題就剩下:
- 那條「代表趨勢的線」到底是怎麼算出來的?
- 模型怎麼判斷「人潮」比「氣溫」重要?
- 為什麼有時候預測會準,有時候卻誤差很大?
- 如果希望預測再正確點,又該怎麼做?
👉 這些,才是線性迴歸真正的核心。
我會用 「考點語言+命題邏輯」 來加力。
三、為什麼考試一再出現「線性迴歸」?
在各類 AI/資料分析相關考試中(包含 AI-900、AI 應用規劃師),
線性迴歸(Linear Regression)幾乎一定會出現,原因其實很單純:
因為它是「最基本、最容易用來判斷有沒有搞懂『預測』在做什麼」的模型。
考試不是要人人當資料科學家,
而是要確認我們可以分得出下面這些事:
1️⃣ 考試想要問的:這是不是「迴歸問題」?
回到小莉的情境,考試通常會這樣包裝題目:
【考試快速判斷】
只要題目出現以下關鍵字:
✔ 預測營收
✔ 預測銷售量
✔ 預測數值大小
✔ 依據過去資料推估
而且答案是一個「數字」而不是「類別」,
這類題目,第一時間就該往「迴歸模型」思考。
👉 像小莉的「淨營收」、「總杯數」,
都屬於連續數值(Continuous Value),
因此,這就是為什麼它會被歸類為「迴歸問題」。
2️⃣ 那為什麼是「線性」迴歸,而不是其他模型?
線性迴歸的核心假設是:
當某些因素增加或減少時,
預測結果會跟著「直線-方向性的變化」。
以小莉為例:
- 上班族人數 ↑ → 營收傾向 ↑
- 下雨天數 ↑ → 營收傾向 ↓
這種「一增一減、方向明確」的關係,
正是線性迴歸最典型的應用情境。
3️⃣ 線性迴歸「負責解決什麼問題」?
線性迴歸在考試中,預測的是「預期值(Expected Value)」,
而不是實際一定發生的結果。
這也是為什麼,考試題目常出現這類敘述:
- 「最可能的營收為何」
- 「合理的預測值為何」
- 「依據過去資料推估」
👉 看到這種關鍵字,線性迴歸通常就是正解方向。
🧠本篇關鍵字整理:
- 輸入資料 → 人潮、假日 → 特徵 (Feature)
- 預測目標 → 銷售額 → 標籤 (Label)
- 模型類型 → 找出營業額預測線 → 線性迴歸 (Linear Regression)
- 學習模式 → 用過去記錄(答案)教電腦 → 監督式學習 (Supervised Learning)
最後,剩下幾個實務操作的問題:
- 那條「直線」是怎麼算出來的?不能是「曲線」嗎?
- 為什麼會有誤差?誤差怎麼修正?
- 當考慮的不只「人潮」時,線性迴歸夠用嗎?
- 怎麼評估它是否可信?
👉 下一篇:實務技術篇繼續拆解。
課程說明
終於講到考試了。
每篇文章舖設的故事或場景,是希望讀者能以理解的方式代入並消化內容,畢竟,用「背的」真的太痛苦了。
🔖 以下內容為本系列的學習安排與閱讀指引。
- 為方便大家學習,我將全部章節進行劃分,詳見導覽文。
- 同時,每當完成某一主題介紹時,我也會在圖上「插旗」,讓學習者明白自己的進度。
- 部分文章會納入收費區,內容將以考試情境為主軸進行整理,不僅補齊必要的模型原理與判斷邏輯, 也會搭配模擬考題,協助大家從「看懂」轉化為「選得對」。
- 建議閱讀前以建立觀念為主,不要死背,因為實務應用與考試題目都很靈活,唯有理解才能判斷應變。
















