Softmax

更新於 發佈於 閱讀時間約 1 分鐘

Softmax 函數主要用於多分類問題,將輸出層的原始分數(logits)轉換為機率分佈。每個輸出的機率範圍在 0 到 1 之間,且所有輸出機率的總和為 1。

它的步驟包括:

1️⃣將每個輸出取指數化,放大差異。

2️⃣計算所有輸出的指數和(正規化因子)。

3️⃣ 將每個輸出的指數值除以總和,得到機率值。


👉簡單來說,Softmax 將數值轉換為易於解釋的分類機率,廣泛用於神經網路的輸出層。


raw-image


avatar-img
0會員
34內容數
留言
avatar-img
留言分享你的想法!

































































Princend的沙龍 的其他內容
MSE vs. MAE 差異比較 MSE(均方誤差): 1️⃣ 對大誤差更敏感(平方放大效果)。 2️⃣ 更適合需要懲罰大誤差的應用,如醫療預測。 3️⃣ 單位是數據單位的平方,解釋性稍差。 MAE(平均絕對誤差): 1️⃣ 對大誤差不敏感,對異常值更穩健。 2️⃣ 單位與原始數據相同
MAE(Mean Absolute Error) 平均絕對誤差 又被稱為 L1 損失 常被用於 評估迴歸模型的準確性 對異常值穩定性比較好 數值越低代表模型越好
橫軸代表輸入值 (z) 縱軸代表輸出值 (J(z)) 當輸入值小於或等於閾值 κ 時,函數輸出為 0 當輸入值大於閾值 κ 時,函數輸出等於輸入值本身。 閾值 κ意味著只有超過閾值的輸入特徵才會被模型考慮,而其他特徵則會被忽略(稀疏性) google的gemma2模型有應用到此act
1.從提案分布 q(x) 中抽樣候選點 x。 2.隨機生成 y∼U(0,c⋅q(x))。 3.若 y ≤ p(x),接受點 x;否則拒絕。
1.計算其累積分布函數,使得 𝐹(𝑥)的範圍為 [0,1] 2.從均勻分布 𝑈(0,1) 中生成一個隨機數 𝑢(藍色的點) 3.計算反函數 4.從反函數中抽樣x(紅色的點)
PDF (Probability Density Function,機率密度函數)是隨機變數的機率密度,描述分布形狀 CDF (Cumulative Distribution Function,累積分布函數)是其累積機率,表示小於等於某值的總機率。PDF 是 CDF 的導數,CDF 是 PDF 的積
MSE vs. MAE 差異比較 MSE(均方誤差): 1️⃣ 對大誤差更敏感(平方放大效果)。 2️⃣ 更適合需要懲罰大誤差的應用,如醫療預測。 3️⃣ 單位是數據單位的平方,解釋性稍差。 MAE(平均絕對誤差): 1️⃣ 對大誤差不敏感,對異常值更穩健。 2️⃣ 單位與原始數據相同
MAE(Mean Absolute Error) 平均絕對誤差 又被稱為 L1 損失 常被用於 評估迴歸模型的準確性 對異常值穩定性比較好 數值越低代表模型越好
橫軸代表輸入值 (z) 縱軸代表輸出值 (J(z)) 當輸入值小於或等於閾值 κ 時,函數輸出為 0 當輸入值大於閾值 κ 時,函數輸出等於輸入值本身。 閾值 κ意味著只有超過閾值的輸入特徵才會被模型考慮,而其他特徵則會被忽略(稀疏性) google的gemma2模型有應用到此act
1.從提案分布 q(x) 中抽樣候選點 x。 2.隨機生成 y∼U(0,c⋅q(x))。 3.若 y ≤ p(x),接受點 x;否則拒絕。
1.計算其累積分布函數,使得 𝐹(𝑥)的範圍為 [0,1] 2.從均勻分布 𝑈(0,1) 中生成一個隨機數 𝑢(藍色的點) 3.計算反函數 4.從反函數中抽樣x(紅色的點)
PDF (Probability Density Function,機率密度函數)是隨機變數的機率密度,描述分布形狀 CDF (Cumulative Distribution Function,累積分布函數)是其累積機率,表示小於等於某值的總機率。PDF 是 CDF 的導數,CDF 是 PDF 的積
你可能也想看
Google News 追蹤
Thumbnail
本文介紹了在進行資料分析時,將類別欄位轉換為數值欄位的方法,包括Label Encoding、One-Hot Encoding、Binary Encoding、Target Encoding和Frequency Encoding。每種方法的應用範例、優缺點和適用場景都有詳細說明。
前言 在閱讀《強化式學習:打造最強 AlphaZero 通用演算法》時,對一些看似基本,但是重要且會影響到之後實作的項目概念有點疑惑,覺得應該查清楚,所以搞懂後記錄下來,寫下這篇文章(應該說是筆記?)。 正文 下面這段程式碼: model = Sequential() model.add
Thumbnail
解決電腦上遇到的問題、證明正確性、探討效率 並且很著重溝通,說服別人你做的事是正確且有效率的。 內容: 計算模型、資料結構介紹、演算法介紹、時間複雜度介紹。
Thumbnail
本文介紹了在進行資料分析時,將類別欄位轉換為數值欄位的方法,包括Label Encoding、One-Hot Encoding、Binary Encoding、Target Encoding和Frequency Encoding。每種方法的應用範例、優缺點和適用場景都有詳細說明。
前言 在閱讀《強化式學習:打造最強 AlphaZero 通用演算法》時,對一些看似基本,但是重要且會影響到之後實作的項目概念有點疑惑,覺得應該查清楚,所以搞懂後記錄下來,寫下這篇文章(應該說是筆記?)。 正文 下面這段程式碼: model = Sequential() model.add
Thumbnail
解決電腦上遇到的問題、證明正確性、探討效率 並且很著重溝通,說服別人你做的事是正確且有效率的。 內容: 計算模型、資料結構介紹、演算法介紹、時間複雜度介紹。