Feature Normalization

類神經網路訓練批次標準化 (Batch Normalization)

更新於 2024/05/01發佈於 2024/05/01閱讀時間約 2 分鐘

Q: 通常我們在找參數的過程中會發現，我們有沒有辦法改善error surface，讓他看起來不那麼複雜？！

A: 我們可以通過Batch Normalization解決這個問題。

在調整兩個參數的error surface中，w₁與w₂的斜率差異過大，才會造成error surface的圖形太過複雜。所以我們可以想想，怎麼樣讓w₁與w₂產生變化時，loss的變化不會很大，這樣就可以將error surface簡單化？

假設有一個function: y = w₁x₁+w₂x₂，如果x₁的值很小(像是x₁ = 1, 2)，x₂的值很大(像是x₂ = 1000, 2000)，則每當w₁變化時，y的變化也會很小，但x₂變化時，y的變化就會變大，這樣就會造成error surface很複雜。

-> 所以如果我們可以讓x₁與x₂的變化同步，就能讓error surface簡單化。

-> Feature normalization就可以解決這樣的問題。

Feature Normalization

首先，我們根據不同的dimension，求出每個dimension的平均值mean, 標準差standard deviation。

之後，將該dimension的所有值，放入normalization的公式，得到新的值：

x̂_i = x_i - m / σ_i，再放回原本的feature內。

透過這樣的方法，loss在計算時，收斂的速度就會快很多，訓練也會順利很多。

但這有個問題，就是在機器學習中，通常都是非常大量的數據在訓練，這會太過龐大。

所以我們通常會以一個batch作為基準去計算normalization。

-> 這就是Batch Normalization。

除此之外，我們也要注意的是，在normalization之後，還是會通過與參數W的計算或是sigmoid的計算，得到新的值，這樣的值有可能造成原本侷限在0~1的值被放大到差異化加大。所以適時也要為計算完的數值再次做normalization。

Testing normalization value

但我們在訓練完進到testing環節，很多時候沒辦法等一個batch size的資料量都完整後才進行normalization，所以通常pytorch在進行normalization時，會計算moving average，透過已經算出來的batch average，評估出目前的平均值應該是多少。

計算方法： u = pu + (1-p)u^t

u: 到目前為止算出來的平均

u^t:第t個batch的平均

p: 由我們自己設定的hyperparameter（pytorch設定為0.1）

透過這樣的方式，我們能得到moving average的平均值u, 與標準差σ，

可以直接透過這樣的方式計算出batch normalization。

#學習

留言

留言分享你的想法！

dab戴伯的沙龍

1會員

37內容數

dab戴伯的沙龍的其他內容

2024/09/03

機器學習模型訓練問題及解決策略

*本文章為參考李弘毅2021年機器學習課程後的筆記。在訓練模型的時候，常常會遇到訓練上的問題，像是Loss值太大，或是Test出來的結果不如預期，但我們又不知道模型中到底發生了甚麼事，就跟黑盒子一樣。因此，感謝李弘毅教授傳授了一套SOP來幫助我們判斷模型是哪裡出了問題，應該要怎麼解決!!

2024/09/03

機器學習模型訓練問題及解決策略

2024/05/16

BERT與GPT: 自監督學習的大型模型

本文介紹自我監督學習的概念和訓練方式，以BERT和GPT為例，深入探討Masking Input及Fine-Tune的實際操作和可應用性。

2024/05/16

BERT與GPT: 自監督學習的大型模型

本文介紹自我監督學習的概念和訓練方式，以BERT和GPT為例，深入探討Masking Input及Fine-Tune的實際操作和可應用性。

2024/05/15

生成式對抗網路GAN

這篇文章探討了生成式對抗網路中機率分佈的使用與相關的訓練方式，包括Generator不同的點、Distriminator的訓練過程、生成圖片的條件設定等。此外，也提到了GAN訓練的困難與解決方式以及不同的learning方式。文章內容豐富且詳細，涵蓋了GAN的各個相關面向。

2024/05/15

生成式對抗網路GAN

看更多

你可能也想看

小愛和彤彤的小日常的沙龍

告別瞇眼寫功課！喜光TIONE⁺光健康智慧檯燈守護孩子視力

孩子寫功課時瞇眼？小心近視！這款喜光全光譜TIONE⁺光健康智慧檯燈，獲眼科院長推薦，網路好評不斷！全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉，讓孩子學習更舒適、保護眼睛！

#方格新手#保護眼睛#閱讀

2025/06/21

小愛和彤彤的小日常的沙龍

告別瞇眼寫功課！喜光TIONE⁺光健康智慧檯燈守護孩子視力

#方格新手#保護眼睛#閱讀

2025/06/21

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

創作者營運專員/經理（Operations Specialist/Manager）將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力，找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。

#vocus#方格子#求職

2025/06/23

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

2025/06/23

高中數學主題練習—配方法

2024/08/01

高中數學主題練習—配方法

2024/08/01

【資料分析】python資料處理-缺失值處理基礎操作語法彙整

資料前處理（Data Preprocessing）中的重要角色-缺失值處理。從檢查、刪除到填充缺失值，以及插值法和機器學習算法的應用方法。Pandas 缺失值處理基礎方法、進階填充缺失值、鐵達尼號存活預測資料集的示例和機器學習算法填補缺失值方法的介紹與使用。

#數據#基礎#學習

2024/07/31

JayRay 的沙龍

【資料分析】python資料處理-缺失值處理基礎操作語法彙整

2024/07/31

中學數學基礎練習—整數減法練習

2024/07/02

中學數學基礎練習—整數減法練習

2024/07/02

高中數學主題練習—根式化簡

2024/06/25

高中數學主題練習—根式化簡

2024/06/25

高中數學主題練習—根式化簡

2024/06/25

高中數學主題練習—根式化簡

2024/06/25

高中數學主題練習—標準化計算

2024/05/01

高中數學主題練習—標準化計算

2024/05/01

演算法映射化簡的核心觀念在面對新題目的時候，除了重頭想一個新的演算法之外；還有另一個方法，想看看有沒有核心觀念彼此相同的問題與演算法，如果有，就可以把新的題目映射化簡到已知解法的問題，用已知的演算法去解開。接著，我們會介紹幾個範例，並且使用映射化簡的技巧來解題，透過化

#leetcode#python#algorithm

2024/04/30

小松鼠的演算法樂園

化繁為簡: 映射化簡的演算法技巧

#leetcode#python#algorithm

2024/04/30

高中數學主題練習—變異數與標準差計算

2024/04/13

高中數學主題練習—變異數與標準差計算

2024/04/13

最近有新的訂閱者加入，想趁這個機會再分享一次學習心法與建議給第一次練習的讀者、同學們。如果你本身已經很熟練演算法，那隨機挑題目練習ok，可以測試觀念是否正確，並且驗證寫code的效率與正確程度。如果是剛畢業或還在學，以前沒有打過程式競賽。想開始有系統地增強演算法&資料結構的能力

#leetcode#python#algorithm

2024/04/10

小松鼠的演算法樂園

給訂閱者的學習心法&建議

#leetcode#python#algorithm

2024/04/10

程式貓咪

1. 演算法與運算

解決電腦上遇到的問題、證明正確性、探討效率並且很著重溝通，說服別人你做的事是正確且有效率的。內容：計算模型、資料結構介紹、演算法介紹、時間複雜度介紹。

2024/01/23

程式貓咪

1. 演算法與運算

2024/01/23

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News