使用 PyTorch 實現反饋類神經網路程式撰寫的指南

發佈於程式

更新於 2024/11/10發佈於 2024/11/09閱讀時間約 13 分鐘

透過 PyTorch 這個工具程式庫，相對於過往直接由類神經網路公式來撰寫程式，可以大量減少撰寫的時間以及錯誤；更重要的是，可以透過 PyTorch，很輕易地使用 CUDA 來驅動多核 GPU 的運算能力。目前，多核 GPU 運算幾乎是近十年來標準的人工智慧程式開發及研究的方式。

模型學習目標

首先，先就一個單變數的反饋類神經網路 (backpropagation neural network) 來進行簡單的「墨西哥帽」模型學習；這個模型可以繪出如下：

資料的產出可以用簡單的 python 程式來執行。

import numpy as np
import matplotlib.pyplot as plt
x=np.arange(-2*np.pi,2*np.pi,0.1)
y=np.sin(x)*x
plt.xlabel('x')
plt.ylabel('y')
plt.plot(x,y,'b.')
plt.grid()
plt.show()

在 PyTorch 客製類神經網路類別

接下來開始依照 PyTorch 的方式建立類神經網路；首先必須要繼承「torch.nn」的類別原型，然後定義類神經網路的結構以及激發函數，接來來在「forward()」這個函數中，填入類神經網路中層與層之間的關係；這樣就完成了一個常用的「反饋類神經網路」的類別了。

import torch
from torch import nn
class classNeural(nn.Module):
    def __init__(self,n_input,n_hidden,n_output):
        super().__init__()
        self.n_input=n_input
        self.n_hidden=n_hidden
        self.n_output=n_output
        #--------
        self.layer1=nn.Linear(n_input,n_hidden)
        self.layer2=nn.Linear(n_hidden,n_output)
        self.active=nn.Sigmoid()
        #--------
    def forward(self,x):
        x=self.active(self.layer1(x))
        return self.layer2(x）

資料轉換

接下來，我們要把訓練資料轉換成「torch.nn」可以接受的「二維 tensor」型態，所以單變數的訓練資料陣列，轉換成 tensor 之後，要再利用「unsqueeze(dim=1)」增加一個空白的維度；同時，因為 torch.nn 所使用的浮點運算為了計算速度的考量，通常會使用「float32」，而非 numpy default 使用的「float64」，所以也一併在這個階段加入。

#-----------------
X_train=torch.tensor(x.astype('float32')).unsqueeze(dim=1)
Y_train=torch.tensor(y.astype('float32')).unsqueeze(dim=1)
#-----------------

創建類神經網路變數

接下來，我們就創建一個類神經網路，在這裏取名為「neural」；要注意的是，要起始類神經網路時，PyTorch 會將神經網路各個節點的權重設為亂數；為了後續開發或研究的執行追蹤，我們創建類神經網路之前會習慣固定一個亂數種子。

接下來就是設定在「反饋訓練」(backpropagation training) 時所使用的成本函數以及訓練方法；這也就是我覺得使用 PyTorch 的好處之一，只需要作設定而不用寫複雜的程式。

torch.manual_seed(13)
neural=classNeural(1,10,1)
#-----------------
loss_fn=nn.MSELoss() # MSE
optimizer=torch.optim.AdamW(neural.parameters(),lr=0.01)
#-----------------

類神經網路訓練

然後，開始進行類神經網路的訓練；首先，「train()」這個函數通知 PyTorch 接下來進行訓練模式；然後取出在訓練模式下的類神經網路預測值，將預測值與訓練值比較之後計算差異成本「loss_fn()」，然後起啟反饋訓練參數「optimizer.zero_grad()」，進行成本反饋「loss.backward()」，進行反饋訓練「optmizer.step()」；這樣就完成一個「反饋訓練」的迴圈。

neural.train()
n_epoche=5000
mae_x=[]
mae_y=[]
for epoche in range(n_epoche):
    Y_pred=neural(X_train)
    loss=loss_fn(Y_pred,Y_train)
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    if epoche % 100==0:
        neural.eval()
        with torch.inference_mode():
            Y_pred=neural(X_train)
        mae=torch.mean(torch.abs(Y_train-Y_pred)).numpy()
        mae_x.append(epoche)
        mae_y.append(mae)

驗証訓練結果

在這裏我們用了 3000 迴圈的反饋訓練，最後的結果跟原來訓練資料比較可以得來以下的圖形；在使用訓練好的「類神經網路」模式來作預測值計算時，必須要用「eval()」函數來通知 PyTorch，然後在「torch.reference_mode()」的狀態下進行模式運算；以及影響到訓練參數。

neural.eval()
with torch.inference_mode():
    Y_pred=neural(X_train)
y_pred=Y_pred.numpy()
plt.plot(x,y,'b.',label='training data')
plt.plot(x,y_pred,'r-',label='prediction')
plt.grid()
plt.legend(fontsize=12)
plt.xlabel('x')
plt.ylabel('y')
plt.show()

訓練過程誤差趨勢

如果把不同次迴圈的訓練誤差畫出來，可以得到以下的趨勢圖。

torch.manual_seed(13)
neural=classNeural(1,10,1)
#-----------------
loss_fn=nn.MSELoss() # MSE
optimizer=torch.optim.AdamW(neural.parameters(),lr=0.01)
#-----------------
neural.train()
n_epoche=5000
mae_x=[]
mae_y=[]
for epoche in range(n_epoche):
    Y_pred=neural(X_train)
    loss=loss_fn(Y_pred,Y_train)
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    if epoche % 100==0:
        neural.eval()
        with torch.inference_mode():
            Y_pred=neural(X_train)
        mae=torch.mean(torch.abs(Y_train-Y_pred)).numpy()
        mae_x.append(epoche)
        mae_y.append(mae)
#------------
plt.plot(mae_x,mae_y,'b--')
plt.ylabel('mean absolute error')
plt.xlabel('training iteration')
plt.grid()
plt.show()
#------------

訓練過程分析

從誤差趨勢圖上，可以看到有三個不同的訓練階段；如果我們抽樣這三個階段，其實可以觀察到分別在原來訓練資料的不同轉折型態上，有不同的訓練收歛的表現；而且逐步有效的趨近，一直到最後訓練結果接近目標模型後，收歛的進度就會趨緩。

#-------------------- 
# 訓練 3 個類神經網路
#--------------------
index_Weighting=[500,1000,5000]
saved_Weighting=[]
for  i in range(len(index_Weighting)):
    n_epoche=index_Weighting[i]
    torch.manual_seed(13)
    neural=classNeural(1,10,1)
    loss_fn=nn.MSELoss() # MSE
    optimizer=torch.optim.AdamW(neural.parameters(),lr=0.01)
    neural.train()
    
    for epoche in range(n_epoche):
        Y_pred=neural(X_train)
        loss=loss_fn(Y_pred,Y_train)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
    saved_Weighting.append(neural.state_dict())
#-----------------
# 將訓練好的類神經網路進行預測
#-----------------
y_pred=[]
for i in range(len(index_Weighting)):
    neural=classNeural(1,10,1)
    neural.load_state_dict(saved_Weighting[i])
    neural.eval()
    with torch.inference_mode():
        Y_pred=neural(X_train)
    y_pred.append(Y_pred.numpy())
#----------------
# 畫出預測模型結果
#----------------
index_color=['green','brown','red']
for i in range(len(index_Weighting)):
    strLabel='train count:'+str(index_Weighting[i])
    plt.plot(x,y_pred[i],linestyle='dashed',color=index_color[i],label=strLabel)
plt.grid()
plt.legend(fontsize=8)
plt.xlabel('x')
plt.ylabel('y')
plt.show()

4會員

21內容數

作者從國內主要的半導體公司退休，重回校園唸書；開始第三人生。分享退休投資規劃、科技產業經驗以及校園學習點滴。

留言0

查看全部

發表第一個留言支持創作者！

甘果的沙龍的其他內容

開發 Python/PyTorch 多執行緒程式在輝達 nVidia CUDA 環境下

本文說明在安裝實體具有多核 GPU 的環境下，可以透過 Python 「多執行緒的」程式，讓 CPU 及 GPU 依照特性，各自同時進行運算，得到最好的算力配置。

#python #Pytorch #nvidia

使用 PyTorch 進行 CUDA 程式開發在輝達 nVidia Jetson Nano 環境下

本文描敘如何配合 nVidia Jetson Orin Nano 的多核心 GPU 的裝置，利用 PyTorch 來作 CUDA python 程式開發。

#python #cuda #pytorch

Git/Github 版本控管在輝達 nVidia Jetson Nano 環境中的

本篇文章介紹如何在 Jetson Nano 環境 Ubuntu 2.0 使用 git 及 github.com 進行版本控管。文章快速說明如何安裝、建立版本控管目錄及使用常用的指令。透過簡單的步驟，讀者將能夠有效地管理其程式碼版本，提升開發效率。

#版本 #檔案 #程式

建立 Python 虛擬環境在在輝達 nVidia Jetson Nano 環境下

本文介紹如何在Python開發過程中建立虛擬環境以避免程式庫衝突，並使用Jupyter Notebook切換不同的虛擬環境。讓開發者能夠輕鬆地在不同環境中工作，提升開發效率。本文涵蓋從建立虛擬環境到管理Jupyter核心的完整步驟，適合希望優化其Python開發流程的讀者。

#開發 #程式 #jetson

使用 Jupyter Notebook 在輝達 nVidia Nano Python/CUDA 伺服器的安裝與配置

本文介紹如何在 nVidia Nano Python/CUDA 伺服器，遠端使用 Jupyter Notebook 編輯和執行程式。包括Jupyter Notebook 的安裝過程及其配置文件的修改，和遠端存取的機制。本文藉由接近大型公司使用的資訊安全環境的架設，期待相關學生縮短進入業界的學習曲線。

#程式 #編輯 #Jupyter

在輝達 nVidia Jetson Orin Nano 裝置上安裝 PyTorch 的完整流程

本文介紹如何在 nVidia Jetson Orin Nano 裝置上安裝 PyTorch，並運用其 Python 及 CUDA 環境進行機器學習和人工智慧的開發。提供詳細步驟。適合希望在該平臺上開展研究與開發的使用者。

#輝達 #nvidia #邊緣運算

開發 Python/PyTorch 多執行緒程式在輝達 nVidia CUDA 環境下

本文說明在安裝實體具有多核 GPU 的環境下，可以透過 Python 「多執行緒的」程式，讓 CPU 及 GPU 依照特性，各自同時進行運算，得到最好的算力配置。

#python #Pytorch #nvidia

使用 PyTorch 進行 CUDA 程式開發在輝達 nVidia Jetson Nano 環境下

本文描敘如何配合 nVidia Jetson Orin Nano 的多核心 GPU 的裝置，利用 PyTorch 來作 CUDA python 程式開發。

#python #cuda #pytorch

Git/Github 版本控管在輝達 nVidia Jetson Nano 環境中的

#版本 #檔案 #程式

建立 Python 虛擬環境在在輝達 nVidia Jetson Nano 環境下

#開發 #程式 #jetson

使用 Jupyter Notebook 在輝達 nVidia Nano Python/CUDA 伺服器的安裝與配置

#程式 #編輯 #Jupyter

在輝達 nVidia Jetson Orin Nano 裝置上安裝 PyTorch 的完整流程

你可能也想看

《表達與社交學》95 抱怨者嚇走強者，提問者吸引強者，所以貴人運天差地遠

提問的內容越是清晰，強者、聰明人越能在短時間內做判斷、給出精準的建議，他們會對你產生「好印象」，認定你是「積極」的人，有機會、好人脈會不自覺地想引薦給你

#後沙發 #貴人 #人脈

柴郡貓姍蒂的沙龍

2024/08/11

筆記-深度學習模型訓練：在Colab上安裝DGL

前言最近在研究GAT，在網路上看到使用torch和DGL實作的GAT模型的程式碼，就想說下載下來自己跑跑看，這篇文章：Understand Graph Attention Network。途中遇到問題，把找到的解法記錄下來，給也有一樣問題的朋友參考。正文在Colab直接使用： !p

#深度學習 #colab #Colab

Karen的沙龍

2024/07/28

【邁向圖神經網絡GNN】Part5: 建構 GNN model 實作 Cora 資料集結點分類任務

本篇文章介紹如何使用PyTorch構建和訓練圖神經網絡（GNN），並使用Cora資料集進行節點分類任務。通過模型架構的逐步優化，包括引入批量標準化和獨立的消息傳遞層，調整Dropout和聚合函數，顯著提高了模型的分類準確率。實驗結果表明，經過優化的GNN模型在處理圖結構數據具有強大的性能和應用潛力。

#GNN #Graph #dropout