快速瞭解機器學習基本原理

2023/06/02 更新2023/06/02 發佈閱讀 7 分鐘

說明：

這文章其實也是李宏毅老師 2023 年機器學習課程的個人一些學習整理，李老師上課的內容&口吻很精彩，很建議大家直接看李老師的課程影片：完整的所有課程在這裏

機器學習是什麼

傳統的程式設計與機器學習的方法大有不同。前者需要程式設計人員深入了解特定領域的問題和規則，再基於這些知識來編寫程式。相對之下，機器學習的核心理念則是讓機器自行尋找並應用適當的函式來解決我們面臨的問題。

例如，當我們向ChatGPT輸入一段文字時，該系統的任務就是預測出應該如何回應。再例如Midjourney，我們只需輸入一段描述，它就能生成一張對應的照片。而2016年風靡一時的AlphaGo也是機器學習的一個出色應用例子，它能根據當前的棋盤狀況來決定下一步的棋路。

雖然機器學習有著眾多的應用，但其主要任務可以被分為兩類：迴歸和分類。

迴歸問題，簡單來說，就是在給定一些條件後，系統需要輸出一個具體的"數值"。例如，我們可以設計一個PM2.5預測器，透過輸入與PM2.5相關的各種條件，來預測明天的PM2.5指數。

分類問題則相對直觀，它的輸出是一個"類別"，就像是我們在考試時遇到的選擇題或是非題。以垃圾郵件的判斷為例，我們輸入一份電子郵件的資料，然後系統評估它是否為垃圾郵件

然後我們來看看ChatGPT

從實際操作來看，ChatGPT的輸出實際上屬於分類問題。即使它輸出的是一段完整的文字，但如果我們將它分解開來看，它其實是在所有可能的字詞中選擇出最可能的一個（也就是從眾多的類別中選出一類），然後依次輸出。而這種輸出有結構性的文字的方式，也被稱為生成式學習。

生成式學習其實也叫 Structured Learning，它的任務就是使用機器學習來產生有結構的東西，例如文字、影像甚至聲音，ChatGPT 以及 Midjourney 都是這類的應用。

找出函式的三階段

在正式開始機器學習的函式尋找之前，我們首先需要確定我們的問題屬於迴歸問題還是分類問題。

以寶可夢應用為例，假設你要設計的程式是輸入一個寶可夢並預測其攻擊力，這個問題就屬於迴歸問題，因為攻擊力是一個數值。如果你要開發的程式是輸入一張圖片後，判斷這是否為寶可夢，那麼這就是分類問題。

對你要解決的問題有了基本認識之後，你才能在接下來的"選擇範圍"步驟中選擇正確的路徑。

正式尋找我們的適合函式時，基本上可以將這個過程分為三個階段：設定範圍、設定標準、達成目標。下面是這三大階段的工作細節：：

設定範圍階段

這一步主要是選擇使用的神經網絡結構。

全世界的函式種類無窮多，但解決我們問題的合理函式只佔其中一部分範圍。你選擇的神經網絡結構，本質上就是在劃定你認為可能的函式範圍。選擇好你想使用的神經網路結構後，就可以開始下一步，也就是"設定標準"。

設定標準階段

"設定標準"就是定義出一個評量函式好壞的標準，即損失函式（Loss函式）。這個函式能夠計算出我們預測函式與實際狀況的誤差值。以下是一個完整的計算過程例子。

首先，我們需要有一個人工標註資料，並將這些標註作為標準答案。例如，標註人員標記出寶可夢的真實攻擊力為103, 17, 和212。

然後，我們使用預測函式來進行預測。假設我們的預測函式預測出的攻擊力為101, 18, 和200。

最後，我們可以將實際值與預測值相減，計算出每筆資料的誤差值。然後將所有的誤差值總和，這個總和的誤差值就被用來評量我們的函式的好壞（誤差值越小越好）。例如：(103-101) + (18-17) + (212-200) = 15。

另外實務上損失函數可以有多種計算模式，這部分則超過了我們設定檔範圍就不在此說明。

由於所有的評量資料都需要人工標註，所以這種方法也被稱為監督學習（Supervised Learning）。

達成目標階段

在設計標準階段，我們已經確認並理解了損失函式（Loss Function）的計算內涵。而在這一階段的最後，我們需要運用一種方法，透過我們所選定的損失函式，從眾多的候選函式中尋找出最佳的預測模型——這就是我們所謂的「最佳化」。

例如，在我們的候選函式中，我們有 f1, f2, f3 三種函式。假設 f1 預測函式所計算出的誤差值為 5， f2 為 33，而 f3 為 11。從這個例子我們可以看出，根據損失函式的計算，f1 是最佳的選擇。

以上是我們對於"最佳化"的簡化說明。若想深入了解最佳化的方法，這裡有兩個重要的關鍵字可以作為你的學習導引，分別是"梯度下降法（Gradient Descent）"和"反向傳播法（Backpropagation）"。

訓練以及測試

在實務應用中的機器學習訓練，我們通常會將資料劃分為訓練資料和測試資料。訓練資料用於訓練模型，而測試資料則用於在我們找到最好的預測函式後，來驗證我們找到的最佳預測函式是否真的優秀。

為什麼我們訓練出的預測函式，在我們的測試資料上表現不一定會是最好的呢？

這種現象其實很像一個只是很會背書的學生他的情況。他對於看過的題目都能回答得很好，但是一旦遇到新的題目，他可能並沒有真正理解問題的本質，因此回答可能會變得混亂。

總結

在這裡，我們總結了上述的機器學習流程。機器學習實際上是一種使用特定函式來實現我們期望任務的方法。在確定應用哪個函式時，我們可以將其分成三個階段來考慮：設定範圍、確立標準，以及實現目標。每個階段都有許多策略可供選擇。

例如，在設定範圍的階段，我們可以選擇使用深度學習或決策樹等方法；在確立標準的階段，我們可以選擇採用監督式學習、半監督式學習或增強式學習等策略；至於在實現目標的階段，我們則會尋找最佳化的方案，例如梯度下降法或遺傳演算法等方法。

整體而言，這三個階段所要達成的任務，即是本文所述的核心概念。希望這篇文章能幫助大家更深入理解機器學習的運作原理。

備註一、
我們這篇文章內的圖表都是由李宏毅老師的課程投影片中選錄截取出來的，原始投影片可參考李老師課程首頁內連接： Machine Learning 2023 Spring

很感謝李宏毅老師同意使用。

留言

Ted Chen的沙龍

18會員

19內容數

Ted Chen的沙龍的其他內容

2023/08/04

使用 ChatGPT API 建立對話系統學習筆記 - 6

本篇文章深入探討了如何評估模糊訊息在對話系統開發中的它的品質驗證方式，並且使用了類似Rubic評分準則的方法來評估回覆訊息。也介紹了專家回覆與實際回覆比較的評估方式。文章最終目的希望能讓讀者具備開發自己的對話機器人的知識。

2023/08/04

使用 ChatGPT API 建立對話系統學習筆記 - 6

2023/07/28

使用 ChatGPT API 建立對話系統學習筆記 - 5

此文針對對話系統的持續開發和改進過程進行詳細解說，尤其在提示訊息的設計與驗證方面。以大賣場的銷售助理為例，我們設計了提示訊息，進行多次測試與調整，確保回應結果符合預期。透過建立測試集和評估函式，我們實現了批次驗證，確保所有測試項目的有效性。

2023/07/28

使用 ChatGPT API 建立對話系統學習筆記 - 5

2023/07/21

使用 ChatGPT API 建立對話系統學習筆記 - 4

本篇文章探討如何整合大型語言模型與外部程式與資源來生成回應訊息。我們使用OpenAI的Moderation API來確認內容的合適性，並使用新的提示來評估是否真正解答了使用者的疑問。整體流程的匯整讓我們一覽全貌。我們將在下一篇文章中分享更多有關回應訊息評估的細節。

2023/07/21

使用 ChatGPT API 建立對話系統學習筆記 - 4

看更多

你可能也想看

哈斯的煉金工房

投資海外市場就選玉山證券！！玉山證券「小額債」體驗分享 ⛰️

對於害怕風險、擔心賠錢的投資新手，本文介紹債券投資的優勢，說明其風險相對可控、能定期領息的特性，並介紹玉山「小額債」如何以低門檻（1,000美元/澳幣起）提供投資者參與海外債市的機會，強調其低波動、固定收益的友善特點，適合有明確時間目標的資金規劃。

#理財#債券#報酬

2026/02/11

哈斯的煉金工房

投資海外市場就選玉山證券！！玉山證券「小額債」體驗分享 ⛰️

#理財#債券#報酬

2026/02/11

理財好好玩

【一位CFP的日常】打造穩定現金流，不必冒進：小額債的投資思維

本文深入探討債券投資的本質、常見迷思、風險控制方法，並詳細介紹玉山證券「小額債」平臺的特色與優勢，包括低門檻、24hr即時報價、精準篩選等，幫助投資人建立理性、有紀律的債券投資策略，打造穩定的現金流，讓金錢成為財務上的助力。

#CFP#投資#財務

2026/03/13

理財好好玩

【一位CFP的日常】打造穩定現金流，不必冒進：小額債的投資思維

#CFP#投資#財務

2026/03/13

黛•Adele的生活隨筆

自由工作者的理財筆記｜第一次嘗試小額債就上手，打造多元資產配置｜玉山證券小額債券

自由工作者收入不穩定，適合選擇穩健的小額債做資產配置。玉山證券小額債最低一千美金就能開始，支援 24 小時委託下單與即時報價，並提供多條件篩選找到適合的債券。本文分享我的操作體驗與為何小額債能成為自由工作者的安心配置。

#小額債#玉山證券#債券投資

2026/02/10

黛•Adele的生活隨筆

自由工作者的理財筆記｜第一次嘗試小額債就上手，打造多元資產配置｜玉山證券小額債券

#小額債#玉山證券#債券投資

2026/02/10

艾比小劇場

不用每天盯盤，也能讓資產慢慢長大

為什麼「小額債券」會成為越來越多人關注的選項？如果你跟我一樣，經歷過股市大漲的甜、也嚐過劇烈修正的苦，大概就會慢慢明白一件事—— 投資，不只是追求報酬，更是關於「穩定感」。很多投資新手一開始進市場，很容易把全部資金都丟進股票，漲的時候很快樂，跌的時候卻發現自己根本睡不好。這

2026/03/14

2026/03/14

AI 的進展通常分為四個階段：被動機器 (Reactive machines) 有限的記憶體 (Limited memory) 心智理論 (Theory of mind) 自我意識 (Self aware)

2023/06/04

JN的沙龍

說你是 AI，你就是 AI

AI 的進展通常分為四個階段：被動機器 (Reactive machines) 有限的記憶體 (Limited memory) 心智理論 (Theory of mind) 自我意識 (Self aware)

2023/06/04

Ted Chen的沙龍

快速瞭解機器學習基本原理

本文深入探討機器學習的核心概念，包括迴歸、分類和生成式學習。我們解釋了如何使用特定函式來實現期望任務，並將此過程分為設定範圍、確立標準和實現目標三個階段。文章還介紹了如何使用機器學習來訓練和測試模型，並以寶可夢應用為例說明迴歸和分類問題。

2023/06/02

2023/06/02

動動嘴就可以寫程式,Chat GPT橫空出世,程式還要學甚麼?

　　其實講到現在已經是第三篇，這裡還是不會有程式結構及語法的介紹．因為這個專欄是為了讓初學，或是學了很久停滯不前的同學朋友而生的．

#程式#學習#ChatGPT

2023/04/06

holly day的沙龍

動動嘴就可以寫程式,Chat GPT橫空出世,程式還要學甚麼?

　　其實講到現在已經是第三篇，這裡還是不會有程式結構及語法的介紹．因為這個專欄是為了讓初學，或是學了很久停滯不前的同學朋友而生的．

#程式#學習#ChatGPT

2023/04/06

深智數位的沙龍

【深智書摘】機器學習（machine learning）是什麼？

人們透過機器學習（machine learning），試著讓電腦能夠從大量資料中學習成長，不僅可以運用在生活各方面的功能提升，甚至還能透過這些既有的資料，起到鑑往知來的效果，處在當今資訊爆炸的時代，正是你開始學機器學習的最好時機！

#機器學習

2023/02/18

深智數位的沙龍

【深智書摘】機器學習（machine learning）是什麼？

#機器學習

2023/02/18

Liao Yoshi的沙龍

【AI人工智慧】迴歸還是分類

在機器學習領域裡面，我們常常可以將問題分成兩種類型，一種是迴歸問題，而另一種則是分類問題，如何釐清我們所想要解決的問題是隸屬於那一類，是非常重要的一件事情，今天我們就來瞭解一下這兩種問題之間的差異吧！

#人工智慧#Artificialintelligence

2020/11/16

Liao Yoshi的沙龍

【AI人工智慧】迴歸還是分類

#人工智慧#Artificialintelligence

2020/11/16

吐納商業評論的沙龍

給產品經理的AI開發指南#2：如何管理機器學習產品？／Bastiane Huang

在設計機器學習相關產品與服務時，必須瞭解它和一般軟體開發的不同、以及過程中獨特的優先順序與需求。前一篇中探討了機器學習產品開發時，專案經理必須具有的基礎認識和挑戰，本文則延續討論相關的產品管理須知。

#BastianeHuang#AI#ML

2019/11/22

吐納商業評論的沙龍

給產品經理的AI開發指南#2：如何管理機器學習產品？／Bastiane Huang

#BastianeHuang#AI#ML

2019/11/22

吐納商業評論的沙龍

給產品經理的AI開發指南#1／Bastiane Huang

為什麼管理機器學習（ML）產品比一般軟體困難？因為開發ML產品的不確定性和可變性更高；而一般軟體工程則是為機器編寫規則，原本就有高度的確定性。而ML系統可以自行學習，所以並不需要人來編寫規則。總之，「實驗」就是開發ML產品的關鍵。

#BastianeHuang#給產品經理的AI開發指南#AI

2019/11/13

吐納商業評論的沙龍

給產品經理的AI開發指南#1／Bastiane Huang

#BastianeHuang#給產品經理的AI開發指南#AI

2019/11/13

SharpWriter(周乃宏)的沙龍

[The Batch] 通用化能力 x 超材料探索 x 臉不能亂用

到目前為止，機器學習確實達成了許多以往看來不可能的任務，但如同Andrew所述，其實開發的過程非但不容易，還很容易觸法。由於遊戲往往是一個有明確規則的產物，而在製作過程中的規格變化又是那麼頻繁，因此機器學習在遊戲業界的應用更是難上加難，希望Andrew接下來的分析能有所幫助。

#TheBatch#machinelearning

2019/10/31

SharpWriter(周乃宏)的沙龍

[The Batch] 通用化能力 x 超材料探索 x 臉不能亂用

#TheBatch#machinelearning

2019/10/31

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News