使用 PyTorch/CUDA 在 GPU 上撰寫反饋類神經網路程式

發佈於程式

更新於 2024/11/10發佈於 2024/11/10閱讀時間約 7 分鐘

我們在輝達 nVidia Jetson Orin Nano 的裝置上，可以透過 PyToch 以及 CUDA 來使得反饋類神經網路的運算，不透過 CPU 而交由 GPU 來作運算執行；它與原來在 CPU 上執行 PyTorch 的反饋類神經網路的撰寫程式差異不大，這也是我們使用 PyTorch 的好處；絕大部份在 GPU 的平行運算的工作，都由 PyTorch 來解決掉了，程式撰寫只需要專注在程式邏輯的開發。

在同時有 CPU 及 GPU 的運算上，因為所有的人機界面；包括文字輸出入、檔案輸出入以及繪圖，都是直接由 CPU 來負責，而 GPU 只能執行數值計算的部份。因此在使用 CUDA 作 GPU 的運算時，就必須要將資料以及變數在 CPU 及 GPU 之間搬移；這樣才能有效地使用 CUDA/GPU 加速運算的好處。

模型學習目標

首先，我們還是先以「墨西帽」的模型作為例子來作說明。

import numpy as np
import matplotlib.pyplot as plt
x=np.arange(-2*np.pi,2*np.pi,0.1)
y=np.sin(x)*x
plt.xlabel('x')
plt.ylabel('y')
plt.plot(x,y,'b.')
plt.grid()
plt.show()

建立類神經網路類別

再來按照原來在 CPU 環境上，同樣建立類神經網路類別；這一部份也沒有改變。

import torch
from torch import nn

class classNeural(nn.Module):
    def __init__(self,n_input,n_hidden,n_output):
        super().__init__()
        self.n_input=n_input
        self.n_hidden=n_hidden
        self.n_output=n_output
        #--------
        self.layer1=nn.Linear(n_input,n_hidden)
        self.layer2=nn.Linear(n_hidden,n_output)
        self.active=nn.Sigmoid()
        #--------
    def forward(self,x):
        x=self.active(self.layer1(x))
        return self.layer2(x)

確認 CUDA/GPU 裝置準備完備

接下來必需要詢問 PyTorch，目前的裝置是否支援 CUDA 的 GPU 運算。

device=torch.device('cpu')
if torch.cuda.is_available():
    device=torch.device('cuda')

資料搬移到 GPU

然後，我們要把訓練資料透過「to(‘cuda’)」這個函數，將資料從 CPU 搬到 GPU 上。

X_train=torch.tensor(x.astype('float32')).unsqueeze(dim=1).to(device)
Y_train=torch.tensor(y.astype('float32')).unsqueeze(dim=1).to(device)

類神經網路搬移到 GPU

再來，創建類神經網路變數，並且透過「to(‘cuda’)」，將類神經網路也搬到 GPU 上。

torch.manual_seed(13)
neural=classNeural(1,10,1).to(device)

在 GPU 進行類神經網路訓練

一般來說，最花費運算時間及資源的，就是訓練類神經網路，也是最需要使用 GPU 的部份；這一段程式的寫法其實與在 CPU 上的寫法是一樣的，但是因為訓練資料以及類神經網路變數都在 GPU 上，所以整個運算也就會在 GPU 上面執行。

neural.train()
n_epoche=5000
mae_x=[]
mae_y=[]

for epoche in range(n_epoche):
    Y_pred=neural(X_train)
    loss=loss_fn(Y_pred,Y_train)
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

輸出在 GPU 訓練好的模型的預測數值

最後，在輸出訓練好的類神經網路模型的預測值的時候，要注意所有的輸出到人機界面的數值，包括文字顯示或繪圖或檔案的資料，都必須要透過函數「to(‘cpu’)」由 GPU 搬到 CPU 上，才能進行。

neural.eval()
with torch.inference_mode():
    Y_pred=neural(X_train)
y_pred=Y_pred.to("cpu").numpy()
#—————————————————
plt.plot(x,y,'b.',label='training data')
plt.plot(x,y_pred,'r-',label='prediction')
plt.grid()
plt.legend(fontsize=12)
plt.xlabel('x')
plt.ylabel('y')
plt.show()

觀察並確認類神經網路在 GPU 上運算

在執行類神經網路訓練時，我們可以同時透過 Jetson Orin Nano 的「jtop」指令，觀察在 Jetson Orin Nano 裝置上 GPU 的執行狀態，可以確認主要的計算都在 GPU 上面執行。

4會員

22內容數

作者從國內主要的半導體公司退休，重回校園唸書；開始第三人生。分享退休投資規劃、科技產業經驗以及校園學習點滴。

留言

留言分享你的想法！

甘果的沙龍的其他內容

使用 PyTorch 實現反饋類神經網路程式撰寫的指南

本篇文章介紹如何使用 PyTorch 這個強大的工具程式庫來建立一個反饋類神經網路。從單變數的「墨西哥帽」模型學習，到設定類神經網路的結構和訓練方法，資料轉換、類神經網路創建以及訓練過程的步驟。此外，也分析訓練過程中的誤差趨勢，幫助理解模型性能，適合希望快速掌握 PyTorch 的人工智慧開發者。

#人工智慧 #類神經網路 #python

開發 Python/PyTorch 多執行緒程式在輝達 nVidia CUDA 環境下

本文說明在安裝實體具有多核 GPU 的環境下，可以透過 Python 「多執行緒的」程式，讓 CPU 及 GPU 依照特性，各自同時進行運算，得到最好的算力配置。

#python #Pytorch #nvidia

使用 PyTorch 進行 CUDA 程式開發在輝達 nVidia Jetson Nano 環境下

本文描敘如何配合 nVidia Jetson Orin Nano 的多核心 GPU 的裝置，利用 PyTorch 來作 CUDA python 程式開發。

#python #cuda #pytorch

Git/Github 版本控管在輝達 nVidia Jetson Nano 環境中的

本篇文章介紹如何在 Jetson Nano 環境 Ubuntu 2.0 使用 git 及 github.com 進行版本控管。文章快速說明如何安裝、建立版本控管目錄及使用常用的指令。透過簡單的步驟，讀者將能夠有效地管理其程式碼版本，提升開發效率。

#版本 #檔案 #程式

建立 Python 虛擬環境在在輝達 nVidia Jetson Nano 環境下

本文介紹如何在Python開發過程中建立虛擬環境以避免程式庫衝突，並使用Jupyter Notebook切換不同的虛擬環境。讓開發者能夠輕鬆地在不同環境中工作，提升開發效率。本文涵蓋從建立虛擬環境到管理Jupyter核心的完整步驟，適合希望優化其Python開發流程的讀者。

#開發 #程式 #jetson

使用 Jupyter Notebook 在輝達 nVidia Nano Python/CUDA 伺服器的安裝與配置

本文介紹如何在 nVidia Nano Python/CUDA 伺服器，遠端使用 Jupyter Notebook 編輯和執行程式。包括Jupyter Notebook 的安裝過程及其配置文件的修改，和遠端存取的機制。本文藉由接近大型公司使用的資訊安全環境的架設，期待相關學生縮短進入業界的學習曲線。

#程式 #編輯 #Jupyter