快速瞭解機器學習基本原理

更新於 發佈於 閱讀時間約 7 分鐘

說明:

這文章其實也是李宏毅老師 2023 年機器學習課程的個人一些學習整理,李老師上課的內容&口吻很精彩,很建議大家直接看李老師的課程影片: 完整的所有課程在這裏


機器學習是什麼

傳統的程式設計與機器學習的方法大有不同。前者需要程式設計人員深入了解特定領域的問題和規則,再基於這些知識來編寫程式。相對之下,機器學習的核心理念則是讓機器自行尋找並應用適當的函式來解決我們面臨的問題。

raw-image

例如,當我們向ChatGPT輸入一段文字時,該系統的任務就是預測出應該如何回應。再例如Midjourney,我們只需輸入一段描述,它就能生成一張對應的照片。而2016年風靡一時的AlphaGo也是機器學習的一個出色應用例子,它能根據當前的棋盤狀況來決定下一步的棋路。

雖然機器學習有著眾多的應用,但其主要任務可以被分為兩類:迴歸和分類。

raw-image

迴歸問題,簡單來說,就是在給定一些條件後,系統需要輸出一個具體的"數值"。例如,我們可以設計一個PM2.5預測器,透過輸入與PM2.5相關的各種條件,來預測明天的PM2.5指數。

分類問題則相對直觀,它的輸出是一個"類別",就像是我們在考試時遇到的選擇題或是非題。以垃圾郵件的判斷為例,我們輸入一份電子郵件的資料,然後系統評估它是否為垃圾郵件

然後我們來看看ChatGPT

raw-image

從實際操作來看,ChatGPT的輸出實際上屬於分類問題。即使它輸出的是一段完整的文字,但如果我們將它分解開來看,它其實是在所有可能的字詞中選擇出最可能的一個(也就是從眾多的類別中選出一類),然後依次輸出。而這種輸出有結構性的文字的方式,也被稱為生成式學習。

生成式學習其實也叫 Structured Learning,它的任務就是使用機器學習來產生有結構的東西,例如文字、影像甚至聲音,ChatGPT 以及 Midjourney 都是這類的應用。

找出函式的三階段

在正式開始機器學習的函式尋找之前,我們首先需要確定我們的問題屬於迴歸問題還是分類問題。

以寶可夢應用為例,假設你要設計的程式是輸入一個寶可夢並預測其攻擊力,這個問題就屬於迴歸問題,因為攻擊力是一個數值。如果你要開發的程式是輸入一張圖片後,判斷這是否為寶可夢,那麼這就是分類問題。

對你要解決的問題有了基本認識之後,你才能在接下來的"選擇範圍"步驟中選擇正確的路徑。

raw-image

正式尋找我們的適合函式時,基本上可以將這個過程分為三個階段:設定範圍、設定標準、達成目標。下面是這三大階段的工作細節::

設定範圍階段

這一步主要是選擇使用的神經網絡結構。

全世界的函式種類無窮多,但解決我們問題的合理函式只佔其中一部分範圍。你選擇的神經網絡結構,本質上就是在劃定你認為可能的函式範圍。選擇好你想使用的神經網路結構後,就可以開始下一步,也就是"設定標準"。

raw-image

設定標準階段

"設定標準"就是定義出一個評量函式好壞的標準,即損失函式(Loss函式)。這個函式能夠計算出我們預測函式與實際狀況的誤差值。以下是一個完整的計算過程例子。

raw-image

首先,我們需要有一個人工標註資料,並將這些標註作為標準答案。例如,標註人員標記出寶可夢的真實攻擊力為103, 17, 和212。

然後,我們使用預測函式來進行預測。假設我們的預測函式預測出的攻擊力為101, 18, 和200。

最後,我們可以將實際值與預測值相減,計算出每筆資料的誤差值。然後將所有的誤差值總和,這個總和的誤差值就被用來評量我們的函式的好壞(誤差值越小越好)。例如:(103-101) + (18-17) + (212-200) = 15。

另外實務上損失函數可以有多種計算模式,這部分則超過了我們設定檔範圍就不在此說明。

由於所有的評量資料都需要人工標註,所以這種方法也被稱為監督學習(Supervised Learning)。

達成目標階段

raw-image

在設計標準階段,我們已經確認並理解了損失函式(Loss Function)的計算內涵。而在這一階段的最後,我們需要運用一種方法,透過我們所選定的損失函式,從眾多的候選函式中尋找出最佳的預測模型——這就是我們所謂的「最佳化」。

raw-image

例如,在我們的候選函式中,我們有 f1, f2, f3 三種函式。假設 f1 預測函式所計算出的誤差值為 5, f2 為 33,而 f3 為 11。從這個例子我們可以看出,根據損失函式的計算,f1 是最佳的選擇。

以上是我們對於"最佳化"的簡化說明。若想深入了解最佳化的方法,這裡有兩個重要的關鍵字可以作為你的學習導引,分別是"梯度下降法(Gradient Descent)"和"反向傳播法(Backpropagation)"。

訓練以及測試

在實務應用中的機器學習訓練,我們通常會將資料劃分為訓練資料和測試資料。訓練資料用於訓練模型,而測試資料則用於在我們找到最好的預測函式後,來驗證我們找到的最佳預測函式是否真的優秀。

raw-image


為什麼我們訓練出的預測函式,在我們的測試資料上表現不一定會是最好的呢?

這種現象其實很像一個只是很會背書的學生他的情況。他對於看過的題目都能回答得很好,但是一旦遇到新的題目,他可能並沒有真正理解問題的本質,因此回答可能會變得混亂。

raw-image

總結

在這裡,我們總結了上述的機器學習流程。機器學習實際上是一種使用特定函式來實現我們期望任務的方法。在確定應用哪個函式時,我們可以將其分成三個階段來考慮:設定範圍、確立標準,以及實現目標。每個階段都有許多策略可供選擇。

例如,在設定範圍的階段,我們可以選擇使用深度學習或決策樹等方法;在確立標準的階段,我們可以選擇採用監督式學習、半監督式學習或增強式學習等策略;至於在實現目標的階段,我們則會尋找最佳化的方案,例如梯度下降法或遺傳演算法等方法。

整體而言,這三個階段所要達成的任務,即是本文所述的核心概念。希望這篇文章能幫助大家更深入理解機器學習的運作原理。

raw-image

備註一、
我們這篇文章內的圖表都是由李宏毅老師的課程投影片中選錄截取出來的,原始投影片可參考李老師課程首頁內連接: Machine Learning 2023 Spring

很感謝李宏毅老師同意使用。

留言
avatar-img
留言分享你的想法!
avatar-img
Ted Chen的沙龍
18會員
19內容數
Ted Chen的沙龍的其他內容
2023/08/04
本篇文章深入探討了如何評估模糊訊息在對話系統開發中的它的品質驗證方式,並且使用了類似Rubic評分準則的方法來評估回覆訊息。也介紹了專家回覆與實際回覆比較的評估方式。文章最終目的希望能讓讀者具備開發自己的對話機器人的知識。
Thumbnail
2023/08/04
本篇文章深入探討了如何評估模糊訊息在對話系統開發中的它的品質驗證方式,並且使用了類似Rubic評分準則的方法來評估回覆訊息。也介紹了專家回覆與實際回覆比較的評估方式。文章最終目的希望能讓讀者具備開發自己的對話機器人的知識。
Thumbnail
2023/07/28
此文針對對話系統的持續開發和改進過程進行詳細解說,尤其在提示訊息的設計與驗證方面。以大賣場的銷售助理為例,我們設計了提示訊息,進行多次測試與調整,確保回應結果符合預期。透過建立測試集和評估函式,我們實現了批次驗證,確保所有測試項目的有效性。
Thumbnail
2023/07/28
此文針對對話系統的持續開發和改進過程進行詳細解說,尤其在提示訊息的設計與驗證方面。以大賣場的銷售助理為例,我們設計了提示訊息,進行多次測試與調整,確保回應結果符合預期。透過建立測試集和評估函式,我們實現了批次驗證,確保所有測試項目的有效性。
Thumbnail
2023/07/21
本篇文章探討如何整合大型語言模型與外部程式與資源來生成回應訊息。我們使用OpenAI的Moderation API來確認內容的合適性,並使用新的提示來評估是否真正解答了使用者的疑問。整體流程的匯整讓我們一覽全貌。我們將在下一篇文章中分享更多有關回應訊息評估的細節。
Thumbnail
2023/07/21
本篇文章探討如何整合大型語言模型與外部程式與資源來生成回應訊息。我們使用OpenAI的Moderation API來確認內容的合適性,並使用新的提示來評估是否真正解答了使用者的疑問。整體流程的匯整讓我們一覽全貌。我們將在下一篇文章中分享更多有關回應訊息評估的細節。
Thumbnail
看更多
你可能也想看
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
AI 的進展通常分為四個階段: 被動機器 (Reactive machines) 有限的記憶體 (Limited memory) 心智理論 (Theory of mind) 自我意識 (Self aware)
Thumbnail
AI 的進展通常分為四個階段: 被動機器 (Reactive machines) 有限的記憶體 (Limited memory) 心智理論 (Theory of mind) 自我意識 (Self aware)
Thumbnail
本文深入探討機器學習的核心概念,包括迴歸、分類和生成式學習。我們解釋了如何使用特定函式來實現期望任務,並將此過程分為設定範圍、確立標準和實現目標三個階段。文章還介紹了如何使用機器學習來訓練和測試模型,並以寶可夢應用為例說明迴歸和分類問題。
Thumbnail
本文深入探討機器學習的核心概念,包括迴歸、分類和生成式學習。我們解釋了如何使用特定函式來實現期望任務,並將此過程分為設定範圍、確立標準和實現目標三個階段。文章還介紹了如何使用機器學習來訓練和測試模型,並以寶可夢應用為例說明迴歸和分類問題。
Thumbnail
  其實講到現在已經是第三篇,這裡還是不會有程式結構及語法的介紹.因為這個專欄是為了讓初學,或是學了很久停滯不前的同學朋友而生的.
Thumbnail
  其實講到現在已經是第三篇,這裡還是不會有程式結構及語法的介紹.因為這個專欄是為了讓初學,或是學了很久停滯不前的同學朋友而生的.
Thumbnail
人們透過機器學習(machine learning),試著讓電腦能夠從大量資料中學習成長,不僅可以運用在生活各方面的功能提升,甚至還能透過這些既有的資料,起到鑑往知來的效果,處在當今資訊爆炸的時代,正是你開始學機器學習的最好時機!
Thumbnail
人們透過機器學習(machine learning),試著讓電腦能夠從大量資料中學習成長,不僅可以運用在生活各方面的功能提升,甚至還能透過這些既有的資料,起到鑑往知來的效果,處在當今資訊爆炸的時代,正是你開始學機器學習的最好時機!
Thumbnail
在機器學習領域裡面,我們常常可以將問題分成兩種類型,一種是迴歸問題,而另一種則是分類問題,如何釐清我們所想要解決的問題是隸屬於那一類,是非常重要的一件事情,今天我們就來瞭解一下這兩種問題之間的差異吧!
Thumbnail
在機器學習領域裡面,我們常常可以將問題分成兩種類型,一種是迴歸問題,而另一種則是分類問題,如何釐清我們所想要解決的問題是隸屬於那一類,是非常重要的一件事情,今天我們就來瞭解一下這兩種問題之間的差異吧!
Thumbnail
在設計機器學習相關產品與服務時,必須瞭解它和一般軟體開發的不同、以及過程中獨特的優先順序與需求。前一篇中探討了機器學習產品開發時,專案經理必須具有的基礎認識和挑戰,本文則延續討論相關的產品管理須知。
Thumbnail
在設計機器學習相關產品與服務時,必須瞭解它和一般軟體開發的不同、以及過程中獨特的優先順序與需求。前一篇中探討了機器學習產品開發時,專案經理必須具有的基礎認識和挑戰,本文則延續討論相關的產品管理須知。
Thumbnail
為什麼管理機器學習(ML)產品比一般軟體困難?因為開發ML產品的不確定性和可變性更高;而一般軟體工程則是為機器編寫規則,原本就有高度的確定性。而ML系統可以自行學習,所以並不需要人來編寫規則。總之,「實驗」就是開發ML產品的關鍵。
Thumbnail
為什麼管理機器學習(ML)產品比一般軟體困難?因為開發ML產品的不確定性和可變性更高;而一般軟體工程則是為機器編寫規則,原本就有高度的確定性。而ML系統可以自行學習,所以並不需要人來編寫規則。總之,「實驗」就是開發ML產品的關鍵。
Thumbnail
到目前為止,機器學習確實達成了許多以往看來不可能的任務,但如同Andrew所述,其實開發的過程非但不容易,還很容易觸法。 由於遊戲往往是一個有明確規則的產物,而在製作過程中的規格變化又是那麼頻繁,因此機器學習在遊戲業界的應用更是難上加難,希望Andrew接下來的分析能有所幫助。
Thumbnail
到目前為止,機器學習確實達成了許多以往看來不可能的任務,但如同Andrew所述,其實開發的過程非但不容易,還很容易觸法。 由於遊戲往往是一個有明確規則的產物,而在製作過程中的規格變化又是那麼頻繁,因此機器學習在遊戲業界的應用更是難上加難,希望Andrew接下來的分析能有所幫助。
Thumbnail
本文為「Robotics 2.0系列」第二篇。在前一篇文章〈AI重新定義機器人〉中,我們談到AI機器人和傳統機器人最大的不同在於自主學習能力,而這樣的改變將使得AI機器人有潛力顛覆各大產業。但究竟AI機器人會發展出什麼樣的應用?對各個產業又會有什麼影響?
Thumbnail
本文為「Robotics 2.0系列」第二篇。在前一篇文章〈AI重新定義機器人〉中,我們談到AI機器人和傳統機器人最大的不同在於自主學習能力,而這樣的改變將使得AI機器人有潛力顛覆各大產業。但究竟AI機器人會發展出什麼樣的應用?對各個產業又會有什麼影響?
Thumbnail
人工智慧、機器學習、深度學習這三個名詞,都是最近經常被提起的行話;它們彼此緊密相關,但意義又不太相同,偶爾還會被誤用。本文就用白話來說明一下,這三個奇妙的東西到底是什麼。
Thumbnail
人工智慧、機器學習、深度學習這三個名詞,都是最近經常被提起的行話;它們彼此緊密相關,但意義又不太相同,偶爾還會被誤用。本文就用白話來說明一下,這三個奇妙的東西到底是什麼。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News