快速瞭解機器學習基本原理

更新於 發佈於 閱讀時間約 6 分鐘

說明:

這文章其實也是李宏毅老師 2023 年機器學習課程的個人一些學習整理,李老師上課的內容&口吻很精彩,很建議大家直接看李老師的課程影片: 完整的所有課程在這裏

機器學習是什麼

傳統的程式設計與機器學習的方法大有不同。前者需要程式設計人員深入了解特定領域的問題和規則,再基於這些知識來編寫程式。相對之下,機器學習的核心理念則是讓機器自行尋找並應用適當的函式來解決我們面臨的問題。
例如,當我們向ChatGPT輸入一段文字時,該系統的任務就是預測出應該如何回應。再例如Midjourney,我們只需輸入一段描述,它就能生成一張對應的照片。而2016年風靡一時的AlphaGo也是機器學習的一個出色應用例子,它能根據當前的棋盤狀況來決定下一步的棋路。
雖然機器學習有著眾多的應用,但其主要任務可以被分為兩類:迴歸和分類。
迴歸問題,簡單來說,就是在給定一些條件後,系統需要輸出一個具體的"數值"。例如,我們可以設計一個PM2.5預測器,透過輸入與PM2.5相關的各種條件,來預測明天的PM2.5指數。
分類問題則相對直觀,它的輸出是一個"類別",就像是我們在考試時遇到的選擇題或是非題。以垃圾郵件的判斷為例,我們輸入一份電子郵件的資料,然後系統評估它是否為垃圾郵件
然後我們來看看ChatGPT
從實際操作來看,ChatGPT的輸出實際上屬於分類問題。即使它輸出的是一段完整的文字,但如果我們將它分解開來看,它其實是在所有可能的字詞中選擇出最可能的一個(也就是從眾多的類別中選出一類),然後依次輸出。而這種輸出有結構性的文字的方式,也被稱為生成式學習。
生成式學習其實也叫 Structured Learning,它的任務就是使用機器學習來產生有結構的東西,例如文字、影像甚至聲音,ChatGPT 以及 Midjourney 都是這類的應用。

找出函式的三階段

在正式開始機器學習的函式尋找之前,我們首先需要確定我們的問題屬於迴歸問題還是分類問題。
以寶可夢應用為例,假設你要設計的程式是輸入一個寶可夢並預測其攻擊力,這個問題就屬於迴歸問題,因為攻擊力是一個數值。如果你要開發的程式是輸入一張圖片後,判斷這是否為寶可夢,那麼這就是分類問題。
對你要解決的問題有了基本認識之後,你才能在接下來的"選擇範圍"步驟中選擇正確的路徑。
正式尋找我們的適合函式時,基本上可以將這個過程分為三個階段:設定範圍、設定標準、達成目標。下面是這三大階段的工作細節::

設定範圍階段

這一步主要是選擇使用的神經網絡結構。
全世界的函式種類無窮多,但解決我們問題的合理函式只佔其中一部分範圍。你選擇的神經網絡結構,本質上就是在劃定你認為可能的函式範圍。選擇好你想使用的神經網路結構後,就可以開始下一步,也就是"設定標準"。

設定標準階段

"設定標準"就是定義出一個評量函式好壞的標準,即損失函式(Loss函式)。這個函式能夠計算出我們預測函式與實際狀況的誤差值。以下是一個完整的計算過程例子。
首先,我們需要有一個人工標註資料,並將這些標註作為標準答案。例如,標註人員標記出寶可夢的真實攻擊力為103, 17, 和212。
然後,我們使用預測函式來進行預測。假設我們的預測函式預測出的攻擊力為101, 18, 和200。
最後,我們可以將實際值與預測值相減,計算出每筆資料的誤差值。然後將所有的誤差值總和,這個總和的誤差值就被用來評量我們的函式的好壞(誤差值越小越好)。例如:(103-101) + (18-17) + (212-200) = 15。
另外實務上損失函數可以有多種計算模式,這部分則超過了我們設定檔範圍就不在此說明。
由於所有的評量資料都需要人工標註,所以這種方法也被稱為監督學習(Supervised Learning)。

達成目標階段

在設計標準階段,我們已經確認並理解了損失函式(Loss Function)的計算內涵。而在這一階段的最後,我們需要運用一種方法,透過我們所選定的損失函式,從眾多的候選函式中尋找出最佳的預測模型——這就是我們所謂的「最佳化」。
例如,在我們的候選函式中,我們有 f1, f2, f3 三種函式。假設 f1 預測函式所計算出的誤差值為 5, f2 為 33,而 f3 為 11。從這個例子我們可以看出,根據損失函式的計算,f1 是最佳的選擇。
以上是我們對於"最佳化"的簡化說明。若想深入了解最佳化的方法,這裡有兩個重要的關鍵字可以作為你的學習導引,分別是"梯度下降法(Gradient Descent)"和"反向傳播法(Backpropagation)"。

訓練以及測試

在實務應用中的機器學習訓練,我們通常會將資料劃分為訓練資料和測試資料。訓練資料用於訓練模型,而測試資料則用於在我們找到最好的預測函式後,來驗證我們找到的最佳預測函式是否真的優秀。
為什麼我們訓練出的預測函式,在我們的測試資料上表現不一定會是最好的呢?
這種現象其實很像一個只是很會背書的學生他的情況。他對於看過的題目都能回答得很好,但是一旦遇到新的題目,他可能並沒有真正理解問題的本質,因此回答可能會變得混亂。

總結

在這裡,我們總結了上述的機器學習流程。機器學習實際上是一種使用特定函式來實現我們期望任務的方法。在確定應用哪個函式時,我們可以將其分成三個階段來考慮:設定範圍、確立標準,以及實現目標。每個階段都有許多策略可供選擇。
例如,在設定範圍的階段,我們可以選擇使用深度學習或決策樹等方法;在確立標準的階段,我們可以選擇採用監督式學習、半監督式學習或增強式學習等策略;至於在實現目標的階段,我們則會尋找最佳化的方案,例如梯度下降法或遺傳演算法等方法。
整體而言,這三個階段所要達成的任務,即是本文所述的核心概念。希望這篇文章能幫助大家更深入理解機器學習的運作原理。

備註一、
我們這篇文章內的圖表都是由李宏毅老師的課程投影片中選錄截取出來的,原始投影片可參考李老師課程首頁內連接: Machine Learning 2023 Spring

很感謝李宏毅老師同意使用。
為什麼會看到廣告
avatar-img
18會員
19內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Ted Chen的沙龍 的其他內容
這篇文章揭示了訓練GPT模型的三個核心技術:預訓練、微調及增強式學習。預訓練利用大量網路資料提供基礎能力;微調讓GPT更貼近人類思維偏好;增強式學習最終優化模型回答問題的方式。此外,多語言預訓練能讓GPT在一語言的任務學習後,自動掌握其他語言的同樣任務。
這篇文章介紹了ChatGPT,一種大型的語言模型,能以自然語言回答問題,但不透過搜尋罐頭文字或網路內容。其核心技術是自監督式學習,通過大量的網路資料進行訓練,讓模型能進行文字接龍。儘管GPT系列經歷了多次演進,並需用大量的訓練資料,它的問答能力仍有待提升。然而,透過不斷優化,我們已有了更進一步的版本
由于 ChatGPT 的出現讓我們看到了聊天機器人的新可能性,我們這篇文章的目的,就是要來製作第一個屬於自己的聊天機器人。 我們先來準備範例的程式碼,並且稍後會再跟大家介紹要設計自己的 ChatGPT 聊天機器人的重要概念。 初始專案與環境設定 下載程式碼 請先使用下面這一段指令下載我們的範例程式碼
這篇其實就是 Andrew Ng 大大與 OpenAI 合作的一門免費課程【Chatgpt Prompt Engineering For Developers - Guideline】章節的第二段筆記。很建議大家直接看原本的課程影片,內容蠻淺顯易懂的。 第一段筆記在這:開發者的 ChatGPT 提示
這篇其實就是 Andrew Ng 大大與 OpenAI 合作的一門免費課程【Chatgpt Prompt Engineering For Developers】的筆記。很建議大家直接看原本的課程影片,內容蠻淺顯易懂的。 另外因為篇幅有限,所以我們會將他的第一堂課的內容(Guidelines),拆分成
在正式以比較技術面角度來認識 ChatGPT / GPT 之前,我們先用幾個簡單的例子來認識 ChatGPT 以及語言模型可以做到怎樣的事情。 什麼是 ChatGPT? 簡單來說明,ChatGPT 是一個背後使用 GPT 語言模型的對話機器人,而它可以做什麼事情了?我們先來使用幾個常見的語言相關的任
這篇文章揭示了訓練GPT模型的三個核心技術:預訓練、微調及增強式學習。預訓練利用大量網路資料提供基礎能力;微調讓GPT更貼近人類思維偏好;增強式學習最終優化模型回答問題的方式。此外,多語言預訓練能讓GPT在一語言的任務學習後,自動掌握其他語言的同樣任務。
這篇文章介紹了ChatGPT,一種大型的語言模型,能以自然語言回答問題,但不透過搜尋罐頭文字或網路內容。其核心技術是自監督式學習,通過大量的網路資料進行訓練,讓模型能進行文字接龍。儘管GPT系列經歷了多次演進,並需用大量的訓練資料,它的問答能力仍有待提升。然而,透過不斷優化,我們已有了更進一步的版本
由于 ChatGPT 的出現讓我們看到了聊天機器人的新可能性,我們這篇文章的目的,就是要來製作第一個屬於自己的聊天機器人。 我們先來準備範例的程式碼,並且稍後會再跟大家介紹要設計自己的 ChatGPT 聊天機器人的重要概念。 初始專案與環境設定 下載程式碼 請先使用下面這一段指令下載我們的範例程式碼
這篇其實就是 Andrew Ng 大大與 OpenAI 合作的一門免費課程【Chatgpt Prompt Engineering For Developers - Guideline】章節的第二段筆記。很建議大家直接看原本的課程影片,內容蠻淺顯易懂的。 第一段筆記在這:開發者的 ChatGPT 提示
這篇其實就是 Andrew Ng 大大與 OpenAI 合作的一門免費課程【Chatgpt Prompt Engineering For Developers】的筆記。很建議大家直接看原本的課程影片,內容蠻淺顯易懂的。 另外因為篇幅有限,所以我們會將他的第一堂課的內容(Guidelines),拆分成
在正式以比較技術面角度來認識 ChatGPT / GPT 之前,我們先用幾個簡單的例子來認識 ChatGPT 以及語言模型可以做到怎樣的事情。 什麼是 ChatGPT? 簡單來說明,ChatGPT 是一個背後使用 GPT 語言模型的對話機器人,而它可以做什麼事情了?我們先來使用幾個常見的語言相關的任
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
學習是三個階段的循環: - 具體階段:情報收集,紀錄體驗 - 抽象階段:抽象化,模型化,發現模式 - 應用階段:實踐,檢證 西尾泰和這一套學習的三階段循環:具體,抽象,應用, 是一個很好的起始框架。 嘗試實踐它,然後持續修改, 你就能逐漸找到自己學習新事物的獨門心法。
Thumbnail
感知器是一種基本的神經網路模型,用於二分類問題。它模擬了人腦神經元的工作原理,通過調整權重和偏差值來達到預測和分類的目的。 感知器流程 輸入 資料的輸入: 輸入層接受資料的輸入,每個輸入對應一個特徵,還有一個固定的偏差神經元。 資料經過每個神經元時,會乘上相應的
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
在人工智能的發展歷程中,早期的研究主要側重於將解決問題的規則輸入計算機,試圖通過啟蒙運動理性的思路模擬人類的智能行為。然而,這條路逐漸變得艱難,因為規則過於繁多,無法應對複雜的情境和語境。在這個背景下,一些科學家轉向了神經網絡算法,試圖模擬人腦的感知能力。
機器學習是什麼? 簡單來說,機器學習就是訓練機器尋找Function的一段過程,而這個Function可以幫助我們解決我們遇到的問題,或是幫助我們
大語言模型能夠生成文本,因此被認為是生成式人工智慧的一種形式。 人工智慧的學科任務,是製作機器,使其能執行需要人類智慧才能執行的任務,例如理解語言,便是模式,做出決策。 除了大語言模型,人工智慧也包含了深度學習以及機器學習。 機器學習的學科任務,是透過演算法來實踐AI。 特別
大語言模型,例如OpenAI提供的ChatGPT,是過去幾年發展的深度神經網路模型,開啟自然語言處理的新紀元。
Thumbnail
這一節課說明,如何透過改變給模型的指示或咒語(prompt),來得到不同的結果 。如果直接說結論的話會是,在今天語言模型的能力之下,我們只要交代清楚任務就好,可以包括背景以及需求。而這節課很像是一堂模型咒語的歷史課 XD
Thumbnail
ChatGPT 是 OpenAI 開發的大型語言模型,以其強大的生成能力和對話能力而聞名。 ChatGPT 的訓練過程主要分為兩個階段:預訓練和微調。 微調使用了 RLHF(Reinforcement Learning from Human Feedback)技術,可以有效地提高模型生成內容的質量。
Thumbnail
生成式AI(Generative AI)是近年來人工智慧領域中備受矚目的技術之一。它以機器學習為基礎,通過學習大量數據中的模式和關係,能夠生成各種新的內容,涵蓋文字、圖像、音訊等多個領域。本文將深入探討生成式AI的原理、優缺點以及應用範疇。
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
學習是三個階段的循環: - 具體階段:情報收集,紀錄體驗 - 抽象階段:抽象化,模型化,發現模式 - 應用階段:實踐,檢證 西尾泰和這一套學習的三階段循環:具體,抽象,應用, 是一個很好的起始框架。 嘗試實踐它,然後持續修改, 你就能逐漸找到自己學習新事物的獨門心法。
Thumbnail
感知器是一種基本的神經網路模型,用於二分類問題。它模擬了人腦神經元的工作原理,通過調整權重和偏差值來達到預測和分類的目的。 感知器流程 輸入 資料的輸入: 輸入層接受資料的輸入,每個輸入對應一個特徵,還有一個固定的偏差神經元。 資料經過每個神經元時,會乘上相應的
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
在人工智能的發展歷程中,早期的研究主要側重於將解決問題的規則輸入計算機,試圖通過啟蒙運動理性的思路模擬人類的智能行為。然而,這條路逐漸變得艱難,因為規則過於繁多,無法應對複雜的情境和語境。在這個背景下,一些科學家轉向了神經網絡算法,試圖模擬人腦的感知能力。
機器學習是什麼? 簡單來說,機器學習就是訓練機器尋找Function的一段過程,而這個Function可以幫助我們解決我們遇到的問題,或是幫助我們
大語言模型能夠生成文本,因此被認為是生成式人工智慧的一種形式。 人工智慧的學科任務,是製作機器,使其能執行需要人類智慧才能執行的任務,例如理解語言,便是模式,做出決策。 除了大語言模型,人工智慧也包含了深度學習以及機器學習。 機器學習的學科任務,是透過演算法來實踐AI。 特別
大語言模型,例如OpenAI提供的ChatGPT,是過去幾年發展的深度神經網路模型,開啟自然語言處理的新紀元。
Thumbnail
這一節課說明,如何透過改變給模型的指示或咒語(prompt),來得到不同的結果 。如果直接說結論的話會是,在今天語言模型的能力之下,我們只要交代清楚任務就好,可以包括背景以及需求。而這節課很像是一堂模型咒語的歷史課 XD
Thumbnail
ChatGPT 是 OpenAI 開發的大型語言模型,以其強大的生成能力和對話能力而聞名。 ChatGPT 的訓練過程主要分為兩個階段:預訓練和微調。 微調使用了 RLHF(Reinforcement Learning from Human Feedback)技術,可以有效地提高模型生成內容的質量。
Thumbnail
生成式AI(Generative AI)是近年來人工智慧領域中備受矚目的技術之一。它以機器學習為基礎,通過學習大量數據中的模式和關係,能夠生成各種新的內容,涵蓋文字、圖像、音訊等多個領域。本文將深入探討生成式AI的原理、優缺點以及應用範疇。