《從零開始的資料科學筆記》Day#10:模型挑選、訓練與推論

更新 發佈閱讀 4 分鐘
raw-image

在輔導學員的時候遇過很多初學者會搞不清楚到底模型是什麼?訓練又是怎麼一回事?

因此這篇文章主要是提供初學者一些簡單的概念,知道”模型”和”訓練”是在做什麼,不涉及程式碼撰寫與執行。

希望藉由簡單的說明讓大家可以先了解這些基本概念,可以加快後續實際操作上手的時間。

🔍 什麼是「模型」?

模型就是一個學會如何「預測答案」的程式。 你可以把模型想像成一位學習過大量範例的「預測機器」:

  • 對人來說:透過經驗,我們可以從某人說話的語氣預測他是否生氣。
  • 對模型來說:透過大量的資料,它可以學會「資料 → 結果」的模式,未來當我們提供新資料,它就能給出預測結果。

🔧 技術上來說,模型是由數學公式 + 參數組成(例如線性回歸就是 𝑦=𝑤𝑥+𝑏)。

🧠 什麼是「訓練」(Training)?

訓練就是讓模型學會資料中的規律與模式。 就像一位學生從題目中學習答題技巧,模型在「訓練資料」中學會:

  • 哪些特徵比較重要?
  • 怎麼組合特徵來做出預測?
  • 預測錯誤時怎麼修正參數(這是訓練的核心!)

🔁 簡單的訓練流程包括:

  • 收集資料並做好前處理、特徵工程。
  • 模型做出預測 → 比對答案 → 調整自己。
  • 重複上百次、上千次直到準確率穩定。

以讀書為例

  • 假設你是一位正在準備學測的高中生:
  • 資料:教材、講義、參考書
  • 模型:就是你的大腦
  • 訓練:不斷唸書
  • 訓練結束:唸書直到模擬考成績滿意

📦 什麼是「推論」(Inference)?

推論就是用訓練好的模型,對「新資料」做預測。 舉例來說:

  • 你訓練一個模型識別貓狗照片。
  • 當你給它一張「沒看過的新圖片」,它會告訴你:「這是狗」。

🧰 模型可以幫我們做什麼?

raw-image

🧬模型挑選、訓練與推論

這三個階段是 將資料轉化為預測力 的核心。

🌟 一、模型挑選(Model Selection)

raw-image

✅ 常見模型選擇依據

raw-image

🔧 2. 模型訓練(Model Training)

使用處理過的資料來訓練模型,使其學會資料與標籤之間的關係。

raw-image

說明

  • 若模型在訓練集準確度高但在驗證集很差,表示過擬合。
  • 可透過 Dropout、正規化、簡化模型、更多資料等方式防止過擬合。
  • 資料不平衡的情況(如二元分類中的偏斜),可能需要用 SMOTE 或重新取樣技術。

🚀 3. 模型推論(Prediction / Inference)

將訓練好的模型應用於「從未看過的資料」做出預測。

raw-image

說明

  • 推論資料的欄位順序與格式必須與訓練資料完全一致。
  • 若有 pipeline,應該把特徵工程與模型封裝在一起(如使用 sklearn.pipeline)。

🎯 機器學習流程圖

知道什麼是模型、什麼是訓練之後,可以進一步地了解機器學習的整個流程是怎麼運作的,從資料取得開始一直到最後預測的應用。

接下來的文章會慢慢說明機器學習到底在學什麼東西、怎麼學、以及有哪些學習的方法跟應用。

raw-image


留言
avatar-img
留言分享你的想法!
avatar-img
Ethan的AI學習筆記
4會員
27內容數
我是一個不務正業的資料科學家,從零開始學習的路途上跌跌撞撞,跌過許多坑,也撞過許多牆... 當有人迷失方向時,希望這些筆記可以成為你的指南針。
Ethan的AI學習筆記的其他內容
2025/06/23
🙋‍♀️ 什麼是特徵(Feature)? 想像一個情境: 你想領養一隻小狗,到了收容所後,該怎麼跟承辦人員描述你想要的狗狗呢? 你可能會說:「我想要一隻可愛的小狗。」 但這樣的描述太模糊了,對方可能無法立刻理解你的偏好。
Thumbnail
2025/06/23
🙋‍♀️ 什麼是特徵(Feature)? 想像一個情境: 你想領養一隻小狗,到了收容所後,該怎麼跟承辦人員描述你想要的狗狗呢? 你可能會說:「我想要一隻可愛的小狗。」 但這樣的描述太模糊了,對方可能無法立刻理解你的偏好。
Thumbnail
2025/06/18
好不容易學習完資料科學三大基礎套件(NumPy / Pandas / Matplotlib)之後,就可以開始學習什麼是資料前處理(Data Preprocessing)、為什麼要做?、以及怎麼做?
Thumbnail
2025/06/18
好不容易學習完資料科學三大基礎套件(NumPy / Pandas / Matplotlib)之後,就可以開始學習什麼是資料前處理(Data Preprocessing)、為什麼要做?、以及怎麼做?
Thumbnail
2025/06/17
Python/Pandas中的None VS NaN 大家在進行資料清理時一定會遇到一個問題,到底缺失值、空值要怎麼判斷,以及如何處理? 而且時常會被他們的定義搞得頭昏腦脹…
Thumbnail
2025/06/17
Python/Pandas中的None VS NaN 大家在進行資料清理時一定會遇到一個問題,到底缺失值、空值要怎麼判斷,以及如何處理? 而且時常會被他們的定義搞得頭昏腦脹…
Thumbnail
看更多
你可能也想看
Thumbnail
在小小的租屋房間裡,透過蝦皮購物平臺採購各種黏土、模型、美甲材料等創作素材,打造專屬黏土小宇宙的療癒過程。文中分享多個蝦皮挖寶地圖,並推薦蝦皮分潤計畫。
Thumbnail
在小小的租屋房間裡,透過蝦皮購物平臺採購各種黏土、模型、美甲材料等創作素材,打造專屬黏土小宇宙的療癒過程。文中分享多個蝦皮挖寶地圖,並推薦蝦皮分潤計畫。
Thumbnail
小蝸和小豬因購物習慣不同常起衝突,直到發現蝦皮分潤計畫,讓小豬的購物愛好產生價值,也讓小蝸開始欣賞另一半的興趣。想增加收入或改善伴侶間的購物觀念差異?讓蝦皮分潤計畫成為你們的神隊友吧!
Thumbnail
小蝸和小豬因購物習慣不同常起衝突,直到發現蝦皮分潤計畫,讓小豬的購物愛好產生價值,也讓小蝸開始欣賞另一半的興趣。想增加收入或改善伴侶間的購物觀念差異?讓蝦皮分潤計畫成為你們的神隊友吧!
Thumbnail
前言 讀了許多理論,是時候實際動手做做看了,以下是我的模型訓練初體驗,有點糟就是了XD。 正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,
Thumbnail
前言 讀了許多理論,是時候實際動手做做看了,以下是我的模型訓練初體驗,有點糟就是了XD。 正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,
Thumbnail
這篇內容,介紹了知識傳遞的三種型態,以及GameMaker教學的分類方式。閱讀本篇指南,能夠理解GameMaker教學的整體規劃和知識結構。
Thumbnail
這篇內容,介紹了知識傳遞的三種型態,以及GameMaker教學的分類方式。閱讀本篇指南,能夠理解GameMaker教學的整體規劃和知識結構。
Thumbnail
高中數學主題練習—根式化簡
Thumbnail
高中數學主題練習—根式化簡
Thumbnail
語言模型與文字表示以不同的方式來分析自然語言的詞語分佈及語意關係。本文章簡要介紹了語言模型、Word2vec、FastText、GloVe和Transformer等技術,並提供了實際的應用參考點,幫助讀者深入理解自然語言處理的技術。
Thumbnail
語言模型與文字表示以不同的方式來分析自然語言的詞語分佈及語意關係。本文章簡要介紹了語言模型、Word2vec、FastText、GloVe和Transformer等技術,並提供了實際的應用參考點,幫助讀者深入理解自然語言處理的技術。
Thumbnail
由於不是這方面的專業,所以一切靠爬文嘗試,我的學習之路不見得正確,就記錄一下自我學習的過程。若有高手見文願指點一二,實屬我之榮幸。
Thumbnail
由於不是這方面的專業,所以一切靠爬文嘗試,我的學習之路不見得正確,就記錄一下自我學習的過程。若有高手見文願指點一二,實屬我之榮幸。
Thumbnail
最近有新的訂閱者加入, 想趁這個機會再分享一次學習心法與建議給第一次練習的讀者、同學們。 如果你本身已經很熟練演算法,那隨機挑題目練習ok,可以測試觀念是否正確,並且驗證寫code的效率與正確程度。 如果是剛畢業或還在學,以前沒有打過程式競賽。 想開始有系統地增強演算法&資料結構的能力
Thumbnail
最近有新的訂閱者加入, 想趁這個機會再分享一次學習心法與建議給第一次練習的讀者、同學們。 如果你本身已經很熟練演算法,那隨機挑題目練習ok,可以測試觀念是否正確,並且驗證寫code的效率與正確程度。 如果是剛畢業或還在學,以前沒有打過程式競賽。 想開始有系統地增強演算法&資料結構的能力
Thumbnail
延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,這堂課接續介紹其中第 3、4 個方法
Thumbnail
延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,這堂課接續介紹其中第 3、4 個方法
Thumbnail
這一節課說明,如何透過改變給模型的指示或咒語(prompt),來得到不同的結果 。如果直接說結論的話會是,在今天語言模型的能力之下,我們只要交代清楚任務就好,可以包括背景以及需求。而這節課很像是一堂模型咒語的歷史課 XD
Thumbnail
這一節課說明,如何透過改變給模型的指示或咒語(prompt),來得到不同的結果 。如果直接說結論的話會是,在今天語言模型的能力之下,我們只要交代清楚任務就好,可以包括背景以及需求。而這節課很像是一堂模型咒語的歷史課 XD
Thumbnail
今天來講:統計模擬研究的入門文章。(2023-08-23)
Thumbnail
今天來講:統計模擬研究的入門文章。(2023-08-23)
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News