【AI 基礎】⊂ 資料科學 vs 機器學習 vs 監督式學習

更新 發佈閱讀 4 分鐘
你其實不是在選技術,而是在辨識自己的思考方式。

AI 世界裡常出現三個名詞:

資料科學(Data Science)、機器學習(Machine Learning)、監督式學習(Supervised Learning)。

多數人把它們當成技術分類,但我越使用 AI、越與不同背景的人合作,越發現:
這三個詞背後,其實藏著三種完全不同的「思考模式」,每個人都在其中擁有自己的偏好與性格。

這篇文章不是技術教學,而是想把「技術背後的思維邏輯」翻譯成更貼近現實的語言。讓你在面對 AI、面對工作、面對合作時,看清楚:你究竟是在用哪一種模式思考。

<轉引本文/改編本文請標註作者(Hsiao-Hsuan Chang, 2025)以及附上本文連結>

資料科學 vs 機器學習 vs 監督式學習

資料科學 vs 機器學習 vs 監督式學習

一、資料科學:整理者性格(The Synthesizer Trait)

資料科學真正關心的不是模型,而是 現實世界的混亂。

資料永遠是亂的:有缺漏、有錯字、有不同格式、有奇怪時間軸。
整理者性格的人看到這些,第一反應不是「開始做」,而是:

• 先把東西排好
• 定義清楚語意
• 建構分類與框架
• 讓問題變得「可被模型理解」

他們在做的事情包括:
• 資料清理(Data Cleaning)
• 特徵工程(Feature Engineering)
• 問題框架(Problem Framing)
• 探索式分析(EDA)

這類人天生對「混亂」敏感,也對「秩序」有高度耐受力。
他們常會自動整理桌面、畫結構圖、建立分類系統,
把複雜的資訊整理成可以對話的形式。

整理者的信念很清楚:

「如果問題沒有被定義清楚,任何模型都只會讓混亂更混亂。」


二、機器學習:實驗者性格(The Experimenter Trait)

如果說資料科學是「把世界整理乾淨」,
那機器學習就是「接受世界永遠不會乾淨,然後直接開始實驗」。

實驗者性格的人關注的是「能不能跑得動」。
他們會:

• 先訓練一次再說(Train)
• 調參數(Tune)
• 比較結果(Evaluate)
• 不斷重跑(Rerun)

他們的邏輯不是「做完準備再開始」,而是:

先跑起來,結果會告訴我下一步。

實驗者不是衝動,而是一種「從結果反推策略」的能力。
整理者靠架構前進;實驗者靠嘗試前進。

兩者都是必需的,只是擅長的方向不同。


三、監督式學習:整理者 × 實驗者的交會點

監督式學習(Supervised Learning)是最能看見兩種性格如何互補的場域。

它需要兩件事:

(1)人類先定義答案(整理者的工作)

整理資料、標註結果、定義 X(輸入)與 Y(輸出)。
這件事沒有結構不行,完全依賴人類的邏輯能力。

(2)模型再從資料中學 X → Y(實驗者的工作)

機器用大量嘗試與修正,逼近正確答案。
所以監督式學習本質上是一種「協作模式」

整理者提供語言與秩序,
實驗者讓模型跑起來,
兩者才能變成一個可運作的系統。

THINKING 留給你的思考

在你的工作和合作經驗裡,
你比較像整理者?實驗者?還是那個擅長對齊的人?

或者,你其實正在不同情境中,
練習切換?

留言
avatar-img
留言分享你的想法!
avatar-img
Anna个策略共構視角
4會員
11內容數
擅長解構與建立系統性商模策略,規劃落地方案 專注於行銷、管理、動物福利、ESG、社會創新 唸過法律系/哲學所/非營利管理所 這裡紀錄我對世界的觀察方式 ----------- 嘿!我不是來替你解題的 我是來重新描繪題目的人
2025/10/24
多數企業不是不想轉型,而是不知道該從哪裡開始。 特別是製造業與代理商,面對 ESG 的第一反應通常是:「那就先算吧。」 但「算」只是起點。 真正決定成敗的,是那個起點能不能被延展。 <轉引本文/改編本文請標註作者(Hsiao-Hsuan Chang, 2025)以及附上本文連結> 一、
Thumbnail
2025/10/24
多數企業不是不想轉型,而是不知道該從哪裡開始。 特別是製造業與代理商,面對 ESG 的第一反應通常是:「那就先算吧。」 但「算」只是起點。 真正決定成敗的,是那個起點能不能被延展。 <轉引本文/改編本文請標註作者(Hsiao-Hsuan Chang, 2025)以及附上本文連結> 一、
Thumbnail
2025/10/13
在研究 AI 的過程裡,我常會思考一個問題: 「如果 AI 真的能學會思考,那它學到的,是人類的知識,還是人類的價值?」 LLM 負責「知道」;監督微調讓 AI 學會「模仿」;RLHF ,教它「選擇」 這三層結構反映人類從「知識」到「判斷」的過程, 也是 AI 學習成為「懂人」的發展路徑。
Thumbnail
2025/10/13
在研究 AI 的過程裡,我常會思考一個問題: 「如果 AI 真的能學會思考,那它學到的,是人類的知識,還是人類的價值?」 LLM 負責「知道」;監督微調讓 AI 學會「模仿」;RLHF ,教它「選擇」 這三層結構反映人類從「知識」到「判斷」的過程, 也是 AI 學習成為「懂人」的發展路徑。
Thumbnail
2025/09/26
這篇專欄以黑客松比賽經驗為引,對照 AI 的兩種思維:垂直(Vertical AI) 專注深耕;水平(Horizontal AI) 強調跨界擴展。這兩種模式同時也映照人格傾向與策略選擇:垂直帶來深度優勢;水平帶來靈活連結。真正的關鍵不在於選邊,而是依情境靈活切換,讓深度與廣度互補,推動創新與競爭力。
Thumbnail
2025/09/26
這篇專欄以黑客松比賽經驗為引,對照 AI 的兩種思維:垂直(Vertical AI) 專注深耕;水平(Horizontal AI) 強調跨界擴展。這兩種模式同時也映照人格傾向與策略選擇:垂直帶來深度優勢;水平帶來靈活連結。真正的關鍵不在於選邊,而是依情境靈活切換,讓深度與廣度互補,推動創新與競爭力。
Thumbnail
看更多
你可能也想看
Thumbnail
不是每個人都適合自己操盤,懂得利用「專業」,才是績效拉開差距的開始
Thumbnail
不是每個人都適合自己操盤,懂得利用「專業」,才是績效拉開差距的開始
Thumbnail
K-Means 是經典非監督聚類:AI 依據資料相似度自動將樣本分成 K 群,流程「指派→更新」迭代至收斂。速度快、易實作,適合客戶分群與圖像壓縮;但須先選 K,對初始中心與離群值敏感,可用 Elbow 曲線或 Silhouette 分數判斷最佳 K。
Thumbnail
K-Means 是經典非監督聚類:AI 依據資料相似度自動將樣本分成 K 群,流程「指派→更新」迭代至收斂。速度快、易實作,適合客戶分群與圖像壓縮;但須先選 K,對初始中心與離群值敏感,可用 Elbow 曲線或 Silhouette 分數判斷最佳 K。
Thumbnail
本篇筆記介紹非監督式學習的三大類別:分群、關聯分析和降維,並深入說明其概念、演算法和應用場景。包含K-Means分群演算法、Apriori關聯分析演算法、PCA降維技術,以及強化學習的基礎概念。
Thumbnail
本篇筆記介紹非監督式學習的三大類別:分群、關聯分析和降維,並深入說明其概念、演算法和應用場景。包含K-Means分群演算法、Apriori關聯分析演算法、PCA降維技術,以及強化學習的基礎概念。
Thumbnail
深入探討監督式學習中的分類預測,涵蓋邏輯回歸、混淆矩陣、模型評估指標 (Accuracy, Precision, Recall, F1 Score)、ROC 曲線、AUC,以及 KNN、SVM 和 Naive Bayes 等分類演算法。還介紹決策樹、Bagging、Boosting 等集成學習方法。
Thumbnail
深入探討監督式學習中的分類預測,涵蓋邏輯回歸、混淆矩陣、模型評估指標 (Accuracy, Precision, Recall, F1 Score)、ROC 曲線、AUC,以及 KNN、SVM 和 Naive Bayes 等分類演算法。還介紹決策樹、Bagging、Boosting 等集成學習方法。
Thumbnail
本文探討了聚類算法中常用的效果評估指標,包括內部和外部指標,並詳細介紹了輪廓係數、群集內距離平方和(WCSS)及Davies-Bouldin指數三種主要指標的計算方法、優缺點與應用場景。這些指標各有特點,適用於不同的聚類場景,有助於有效評估聚類質量,提升無監督學習的效能。
Thumbnail
本文探討了聚類算法中常用的效果評估指標,包括內部和外部指標,並詳細介紹了輪廓係數、群集內距離平方和(WCSS)及Davies-Bouldin指數三種主要指標的計算方法、優缺點與應用場景。這些指標各有特點,適用於不同的聚類場景,有助於有效評估聚類質量,提升無監督學習的效能。
Thumbnail
這篇文章深入探討了數據科學與機器學習中的主要聚類算法,包括 K-means、DBSCAN 和層次聚類。介紹了每種算法的工作原理、優缺點及其適用場景,幫助讀者理解何時選擇何種聚類技術。本文還提供了相關的程式碼範例,方便讀者進一步學習與實踐。
Thumbnail
這篇文章深入探討了數據科學與機器學習中的主要聚類算法,包括 K-means、DBSCAN 和層次聚類。介紹了每種算法的工作原理、優缺點及其適用場景,幫助讀者理解何時選擇何種聚類技術。本文還提供了相關的程式碼範例,方便讀者進一步學習與實踐。
Thumbnail
監督式學習是機器學習的一種方法,通過利用標註數據進行訓練,模型學習輸入特徵與結果標籤間的關係。此方法分為分類與回歸兩類,並涵蓋了多種算法如線性回歸、邏輯回歸和決策樹等。每種算法各有優缺點,適用於不同的應用場景。學習這些內容有助於理解如何選擇合適的模型以解決實際問題。
Thumbnail
監督式學習是機器學習的一種方法,通過利用標註數據進行訓練,模型學習輸入特徵與結果標籤間的關係。此方法分為分類與回歸兩類,並涵蓋了多種算法如線性回歸、邏輯回歸和決策樹等。每種算法各有優缺點,適用於不同的應用場景。學習這些內容有助於理解如何選擇合適的模型以解決實際問題。
Thumbnail
[機器學習][監督式][資料分群] 支持向量機 (Support Vector Machine, SVM)
Thumbnail
[機器學習][監督式][資料分群] 支持向量機 (Support Vector Machine, SVM)
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News