
在輔導學員的時候遇過很多初學者會搞不清楚到底模型是什麼?訓練又是怎麼一回事?
因此這篇文章主要是提供初學者一些簡單的概念,知道”模型”和”訓練”是在做什麼,不涉及程式碼撰寫與執行。
希望藉由簡單的說明讓大家可以先了解這些基本概念,可以加快後續實際操作上手的時間。
🔍 什麼是「模型」?
模型就是一個學會如何「預測答案」的程式。 你可以把模型想像成一位學習過大量範例的「預測機器」:
- 對人來說:透過經驗,我們可以從某人說話的語氣預測他是否生氣。
- 對模型來說:透過大量的資料,它可以學會「資料 → 結果」的模式,未來當我們提供新資料,它就能給出預測結果。
🔧 技術上來說,模型是由數學公式 + 參數組成(例如線性回歸就是 𝑦=𝑤𝑥+𝑏)。
🧠 什麼是「訓練」(Training)?
訓練就是讓模型學會資料中的規律與模式。 就像一位學生從題目中學習答題技巧,模型在「訓練資料」中學會:
- 哪些特徵比較重要?
- 怎麼組合特徵來做出預測?
- 預測錯誤時怎麼修正參數(這是訓練的核心!)
🔁 簡單的訓練流程包括:
- 收集資料並做好前處理、特徵工程。
- 模型做出預測 → 比對答案 → 調整自己。
- 重複上百次、上千次直到準確率穩定。
以讀書為例
- 假設你是一位正在準備學測的高中生:
- 資料:教材、講義、參考書
- 模型:就是你的大腦
- 訓練:不斷唸書
- 訓練結束:唸書直到模擬考成績滿意
📦 什麼是「推論」(Inference)?
推論就是用訓練好的模型,對「新資料」做預測。 舉例來說:
- 你訓練一個模型識別貓狗照片。
- 當你給它一張「沒看過的新圖片」,它會告訴你:「這是狗」。
🧰 模型可以幫我們做什麼?

🧬模型挑選、訓練與推論
這三個階段是 將資料轉化為預測力 的核心。
🌟 一、模型挑選(Model Selection)

✅ 常見模型選擇依據

🔧 2. 模型訓練(Model Training)
使用處理過的資料來訓練模型,使其學會資料與標籤之間的關係。

說明
- 若模型在訓練集準確度高但在驗證集很差,表示過擬合。
- 可透過 Dropout、正規化、簡化模型、更多資料等方式防止過擬合。
- 資料不平衡的情況(如二元分類中的偏斜),可能需要用 SMOTE 或重新取樣技術。
🚀 3. 模型推論(Prediction / Inference)
將訓練好的模型應用於「從未看過的資料」做出預測。

說明
- 推論資料的欄位順序與格式必須與訓練資料完全一致。
- 若有 pipeline,應該把特徵工程與模型封裝在一起(如使用 sklearn.pipeline)。
🎯 機器學習流程圖
知道什麼是模型、什麼是訓練之後,可以進一步地了解機器學習的整個流程是怎麼運作的,從資料取得開始一直到最後預測的應用。
接下來的文章會慢慢說明機器學習到底在學什麼東西、怎麼學、以及有哪些學習的方法跟應用。
