感知器是一種基本的神經網路模型,用於二分類問題。它模擬了人腦神經元的工作原理,通過調整權重和偏差值來達到預測和分類的目的。
圖手畫得有點醜,請見諒
用簡單的程式範例,來說明感知器學習到分類的結果。
import numpy as np
import matplotlib.pyplot as plt
#data
X = np.array([[1,3,3],
[1,4,31],
[1,1,1],
[1,0,2]])
#真實資料
y = np.array([[1],
[1],
[-1],
[-1]])
lr =0.11 # 學習率learning rate : 修正的步伐
out = 0 # 預測值 Y
#權重
w = (np.random.random([3,1])-0.5)*2 # 3*1個亂數
def update():
global X, y, w,lr
out = np.sign(np.dot(X, w)) # 計算預測值
w_c = lr * (X.T.dot(y-out))/int(X.shape[0]) # 計算權重修正值
w = w + w_c
return w,out
for i in range(20):
w,out = update()
x1=[3,3]
y1=[4,31]
x2=[1,1]
y2=[0,2]
#印出權重的變化圖
k = -w[1]/w[2]
d = -w[0]/w[2]
print('k=',k)
print('d=',d)
xdata = (0,5)
plt.figure()
plt.plot(xdata, xdata*k+d,'r')
plt.scatter(x1,y1,c='b')
plt.scatter(x2,y2,c='y')
plt.show()
print(f'最後的結果 out :{out}')
# 驗證學習到的w
# 新的資料 將原本的x資料相反
new_X = np.array([[1,1,1],
[1,0,2],
[1,3,3],
[1,4,31]])
#驗證
out = np.sign(np.dot(new_X, w))
print(f'y : {y}')
print(f'out(預測結果) : {out}')
在最後新資料X,前兩行與後兩行交換,看終端機輸出最後預測的結果也是跟預測結果剛好是兩兩相反,代表學習到的w是有訓練好的。
global X, y, w, lr
:X
(輸入特徵矩陣)、y
(真實標籤向量)、w
(權重向量)和lr
(學習率)是全局變數,意味著這些變數在函數外部已經被定義,並且在函數內部可以直接使用和修改。out = np.sign(np.dot(X, w))
:np.dot(X, w)
計算輸入特徵矩陣 X
和權重向量 w
的點積,得到感知器的輸出值(未經激活函數處理)。np.sign(...)
將點積結果轉換為符號函數的輸出,即將輸出值轉換為 -1 或 1(對於二分類問題)。out
是感知器的預測輸出。w_c = lr * (X.T.dot(y - out)) / int(X.shape[0])
:y - out
計算真實標籤 y
和預測輸出 out
之間的差距X.T.dot(y - out)
計算特徵矩陣的轉置 X.T
和損失函數結果的點積。lr
縮放,控制每次更新的步伐大小。int(X.shape[0])
(即輸入樣本數量),計算平均差值,這樣更新的幅度不會因樣本數量變化而過大。w_c
是權重的修正值,表示應該如何調整權重。w = w + w_c
:w
,加上修正值 w_c
,使得模型朝著減少差值的方向進行調整。程式範例目的是通過一個簡單的更新規則來調整感知器的權重,使得模型的預測結果更接近真實值。每次更新權重時,計算出當前模型的預測值,然後根據預測值與真實值之間的差距來修正權重。
學習率 lr
控制了每次更新的幅度,以避免過大的步伐導致訓練不穩定或者過小的步伐導致收斂過慢。