Sigmoid 函數輸出範圍被壓縮在 0 到 1 之間,當輸入值過大或過小時,導數接近 0,導致權重幾乎停止更新。
此外,由於輸出總是正值且不以 0 為中心,使得權重更新的方向容易產生偏差,因而限制模型探索參數空間,影響收斂速度和學習效率。
tanh 通常應用在隱藏層的非線性變換、數據對稱分布的場景、循環神經網絡(RNN)的隱藏層中...等
1.定義域:(−∞,+∞)
2.範圍:(−1,+1)
3.tanh(0)=0
4.此函數是單調遞增的。
5.此函數處處連續。
6.此函數在其域內處處可微。