AI模型訓練的數學基礎:微分入門教學

更新於 發佈於 閱讀時間約 5 分鐘

AI 模型訓練背後的邏輯需要有「微分」跟方向導數的先備知識,後續才可以對 AI 領域相關的名詞,以及訓練模型的損失函數有更深的了解。本篇先介紹微分,向量內積和方向導數會獨立一篇介紹。在往下看之前需要複習二項式定理、呼叫高中的斜率截距。不過微分我高中也沒學過,所以就一起學習吧!

數學相關影片:Binomial theorem | Polynomial and rational functions | Algebra II | Khan Academy

人工智慧與機器學習會用到數學?

訓練模型時的損失函數微分(如梯度下降法)。所以要學習導數(微分)的定義,微分又有兩大定理:
    • Power Rule
    • Chain Rule

微分公式的推導與極限運算

在微分之前我們會先複習,如何求兩點之間的切線斜率? 如果兩個點的距離趨近於 0 該如何計算?

微分公式的推導與極限運算

微分的定義涉及到極限和多項式的展開。需要有排列組合和二項式定理的先備知識

以下是微分的定義,看不懂很正常,下文有代入數字的示範:

raw-image

極限的功用

上面的Lim 是極限的意思,極限是微積分的基礎工具,用於描述函數在某一點附近的趨勢或行為,特別是當某變數趨近某值(或無窮大)時的變化。

而f'(x)就是

功用與應用

  1. 描述變化趨勢:
    • 幫助我們理解函數的行為
    • 解釋極端情況(如無窮小或無窮大)的數學性質。
  2. 為導數與積分奠定基礎:
    • 微分的定義:導數是通過極限來計算瞬時變化率。
  • 微分和極限的關係

微分公式中的斜率是基於「兩點間的斜率」計算得來,但兩點越靠近(h→0),我們實際上求的是極限。所以,微分可以看作是利用極限算出曲線某點的瞬時斜率。另外還有一些特性

微分實際例子:以實際切線斜率計算

當我們用 X2 來解釋微分概念時,可以這樣理解:


微分是什麼?

假設函數是 f(x)=x,我們要知道它在某一點的瞬間變化率(比如在 )。這就是微分的用途:幫助我們找到曲線上某一點的「切線斜率」。

但因為切線只碰到曲線上的一個點,無法直接用公式算,所以我們用「兩點間的斜率」來逼近切線的斜率。

藍色是f(x)=x 2次方的函數圖形

藍色是f(x)=x 2次方的函數圖形



兩點間的斜率公式

斜率的公式是:

raw-image


這裡 h 表示兩點之間的距離,隨著 h→0,這兩點就越來越靠近。


raw-image
raw-image
這是我的手寫筆記,不過為了排版整齊,只好請 GPT 幫我輸出數學公式了。

這是我的手寫筆記,不過為了排版整齊,只好請 GPT 幫我輸出數學公式了。



微分和極限的關係

微分公式中的斜率是基於「兩點間的斜率」計算得來,但兩點越靠近(h→0h \to 0h→0),我們實際上求的是極限。所以,微分可以看作是利用極限算出曲線某點的瞬時斜率。

講完斜率,我們來看微分的常用公式

Power Rule:次項拉到係數,再降一次


1. d 的意義

在這裡,d 表示微分運算(derivative operator)

raw-image


意思是「對 x 進行微分」。它告訴我們要計算一個函數相對於 x 的變化率。

例如:

raw-image

2. Power Rule 的應用:解釋如何變成 2X

Power Rule 的公式:

raw-image

次數拉到係數:Power Rule 的核心,將 n 拉到前面當作係數。

raw-image

降一次次數:Power Rule 的另一部分,將 xn 的次數 n 減少 1。

raw-image

示範習題:結合二項式定理的微分

微分

微分

計算步驟:把次項拉到常數再降一級

raw-image

Chain Rule 鍊鎖律:先微外再微內

有大函數包小函數的狀況,也可以理解成有很多層括弧的情況。通常會跟 Power Rule 一起使用。

raw-image
raw-image

再舉個例子:

raw-image

多變數偏微分 (有 X 和 Y)

偏微分 (Partial Differentiation)

  • 對象:多變數函數 f(x,y,z,… )。
    • 例如:f(x,y)=x2+y2 
  • 目的:研究函數對某一個變數的變化率,其他變數視為常數不變。


raw-image


以上就是我的學習筆記,圖中公式是靠 ChatGPT 協助生成,如果錯誤請不吝指正!

備註:好感動!外文系畢業後居然還可以保有數學腦,高中數學真的沒有白學~



留言0
查看全部
avatar-img
發表第一個留言支持創作者!
這篇文章介紹了幾種常見的密碼破解方法,例如字典攻擊、密碼填充攻擊、彩虹表攻擊等,並說明使用密碼管理員、以及網站採用 Salting 技術等方式來提升資訊安全。文章也涵蓋了端對端加密、全盤加密、對稱式和非對稱式加密、Passkey 和模數運算等概念,並以淺顯易懂的方式說明其原理和應用。
本篇文章介紹網路爬蟲的基本概念和操作流程,適合初學者瞭解爬蟲的功能與合法使用方式。文章說明爬蟲如何自動蒐集資料及 API 的重要角色,同時提醒用戶注意指南與網站規範。作者也自己嘗試網路爬蟲。也期許自己可以在未來學習到網頁時,能成功操作 LinkedIn 的爬蟲
這個單元我一直很想學習,物件導向 Object Oriented Programming 以前一直以為是一種程式碼,其實是設計程式的觀念,文中我分享了程式碼還有自己想的比喻讓讀者更好理解。除了物件導向,我還介紹其他四種風格的程式碼設計,跟大家一起學習。
深入探討操作系統和中央處理單元 (CPU) 的基本概念,涵蓋 OS 的功能、CPU 的運作,以及程式與執行緒的管理。透過生動的比喻,讀者能夠更輕鬆地理解複雜的硬體運作機制,包括記憶體管理和行程間的通訊。本文為想了解計算機科學的讀者提供了一個清晰的入門指南,讓他們掌握多程式協調與虛擬化技術的基本知識。
終於來到作業系統與 CPU 的最後一個筆記,本篇的學習目標是記憶體分配與虛擬化應用。我會學習邏輯與實體記憶體、分段與頁面管理、虛擬記憶體管理、虛擬記憶體與容器技術。
第五部分:多程式協調與通訊機制,目標:處理多個應用程式的競爭與協作 Interprocess Communication(IPC, 行程間通訊) Race Condition & Critical Section & Dekker's Algorithm Deadlock 與形成的四個條件
這篇文章介紹了幾種常見的密碼破解方法,例如字典攻擊、密碼填充攻擊、彩虹表攻擊等,並說明使用密碼管理員、以及網站採用 Salting 技術等方式來提升資訊安全。文章也涵蓋了端對端加密、全盤加密、對稱式和非對稱式加密、Passkey 和模數運算等概念,並以淺顯易懂的方式說明其原理和應用。
本篇文章介紹網路爬蟲的基本概念和操作流程,適合初學者瞭解爬蟲的功能與合法使用方式。文章說明爬蟲如何自動蒐集資料及 API 的重要角色,同時提醒用戶注意指南與網站規範。作者也自己嘗試網路爬蟲。也期許自己可以在未來學習到網頁時,能成功操作 LinkedIn 的爬蟲
這個單元我一直很想學習,物件導向 Object Oriented Programming 以前一直以為是一種程式碼,其實是設計程式的觀念,文中我分享了程式碼還有自己想的比喻讓讀者更好理解。除了物件導向,我還介紹其他四種風格的程式碼設計,跟大家一起學習。
深入探討操作系統和中央處理單元 (CPU) 的基本概念,涵蓋 OS 的功能、CPU 的運作,以及程式與執行緒的管理。透過生動的比喻,讀者能夠更輕鬆地理解複雜的硬體運作機制,包括記憶體管理和行程間的通訊。本文為想了解計算機科學的讀者提供了一個清晰的入門指南,讓他們掌握多程式協調與虛擬化技術的基本知識。
終於來到作業系統與 CPU 的最後一個筆記,本篇的學習目標是記憶體分配與虛擬化應用。我會學習邏輯與實體記憶體、分段與頁面管理、虛擬記憶體管理、虛擬記憶體與容器技術。
第五部分:多程式協調與通訊機制,目標:處理多個應用程式的競爭與協作 Interprocess Communication(IPC, 行程間通訊) Race Condition & Critical Section & Dekker's Algorithm Deadlock 與形成的四個條件
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
你學習任何數學, 都要問這哪個部分是微積分長出來的, 哪個部分是線性代數長出來的。 當然,你需要先把微積分與線性代數學一次, 知道裡面有哪些內容, 接下來學任何新的東西,其實都是微積分跟線性代數。
Thumbnail
這學習的數學課,我們延伸了上學期的課程,複習了一點微分之後繼續接著上積分。 每堂課老師都會利用講義跟我們講課,並安排一些題目讓我們進行練習計算,在每週也會有一張兩到三題的練習題,讓我們練習,更加熟悉這週所學的知識,並且在其中還會進行一次期中測驗,讓我們看看是否有真正學會這些知識。  一開始我們主
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
你學習任何數學, 都要問這哪個部分是微積分長出來的, 哪個部分是線性代數長出來的。 當然,你需要先把微積分與線性代數學一次, 知道裡面有哪些內容, 接下來學任何新的東西,其實都是微積分跟線性代數。
Thumbnail
這學習的數學課,我們延伸了上學期的課程,複習了一點微分之後繼續接著上積分。 每堂課老師都會利用講義跟我們講課,並安排一些題目讓我們進行練習計算,在每週也會有一張兩到三題的練習題,讓我們練習,更加熟悉這週所學的知識,並且在其中還會進行一次期中測驗,讓我們看看是否有真正學會這些知識。  一開始我們主