更新於 2024/07/24閱讀時間約 7 分鐘

【邁向圖神經網絡GNN】Part2: 使用PyTorch構建圖形結構的全過程

上篇我們基本認識圖神經的起源發展,以及可行的應用場景
那這篇主要筆記使用 pytorch 建立 graph 的幾個概念與實作!

參考的資源: https://youtu.be/Obbr5TdD3Bo

如果還沒有看過上一篇的,可以點以下連結~那我們就開始吧!

【邁向圖神經網絡GNN】Part1: 圖數據的基本元素與應用


為何需要GNN?

為了進一步理解圖神經網絡(GNN)的重要性,讓我們先回顧一下為何需要GNN。在傳統的神經網絡模型中,當我們輸入 Xa,模型會輸出 yA;同樣地,輸入 Xb​ 會得到 yB​。這樣的處理方式假設 Xa 與 Xb 之間沒有直接的相互關係,因此可以將它們視為獨立的實體。

然而,在許多真實世界的應用中,數據點之間往往是互相連接和影響的。例如,在社交網絡、化學分子或語言模型中,元素之間的關係是資料的核心部分。使用GNN,我們不僅處理單獨的數據點Xa​ 或 Xb​,而是處理一個包含多個數據點和它們之間連結的特徵。

GNN的優勢在於其能夠將這些連結關係納入模型中,將關係本身作為特徵進行學習。這使得GNN能夠產生更加精確和有意義的輸出,其中每個輸出不僅反映了單個節點的特性,也反映了節點之間的相互作用。

Graph組成的元素包含:Node、Edge、Node feature、Edge feature、label

引用: https://www.youtube.com/watch?v=Obbr5TdD3Bo

  1. node: 節點,上圖中的 0 , 1 , 2 , 3 都屬於節點
  2. edge: 關係或稱線,兩個節點之間的連結就是關係,例如節點0與節點1之間有一條連線,就是 edge 
  3. node feature: 節點的特徵,例如節點 0 上有兩個特徵 x0 和 x1 
  4. edge feature : 線的特徵,例如節點 0 和節點 1 的連線上的特徵 attr = 1
  5. label : 標註資料,可以定義在 node 上,例如節點 0 的 label 是 1 

使用 pytorch 實作簡單的 graph

1. 首先安裝 package

# Install required packages.
import os
import torch
os.environ['TORCH'] = torch.__version__
print(torch.__version__)
!pip install -q torch-scatter -f https://data.pyg.org/whl/torch-${TORCH}.html!pip install -q torch-sparse -f https://data.pyg.org/whl/torch-${TORCH}.html!pip install -q git+https://github.com/pyg-team/pytorch_geometric.git

2. import 相關套件

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch_geometric
from torch_geometric.nn import MessagePassing
from torch_geometric.utils import to_networkx
import networkx as nx
from torch_geometric.data import Data
import matplotlib.pyplot as plt

3. define graph 

依照上述的五個元素: node、edge、node feature、edge feature、label 去建立~

x = torch.tensor(
[[6, 4],
[0, 1],
[5, 3],
[1, 2]])
edge_index = torch.tensor(
[[0, 1, 0, 2, 1, 2, 2, 3],
[1, 0, 2, 0, 2, 1, 3, 2]])

edge_attr = torch.tensor(
[[1],
[1],
[4],
[4],
[2],
[2],
[5],
[5]])
y = torch.tensor(
[[1],
[0],
[1],
[0]]
)
graph = Data(x=x, edge_index=edge_index, edge_attr=edge_attr, y=y)
print(graph)
  • 第一個部分表達共有4個 node ,其 node feature 分別是 (6,4) (0,1)…
  • 第二個部分紀錄哪些 edge 相連,node 之間的連結可以有方向性,那我們這裡假設是屬於雙向連結,陣列直的看,表達 node 0 和 node 1 有連結,再來會重複一次,接著是 node 0 和 node 2 有連結
  • 第三部分是 edge 上的 feature ,同上也會重複一次,並且對應 edge 的陣列,表達 node 0 和 node 1 之間的連線上的 feature 為 1 
  • 第四部分是 label ,對應 node 的順序,依序表達 node 0 ~ node 4 

那把這個 object 建立起來會輸出

Data(x=[4, 2], edge_index=[2, 8], edge_attr=[8, 1], y=[4, 1])

那如果想再多加一個節點的話,可以這樣做:

# Define graph components

x = torch.tensor(
[[6, 4],
[0, 1],
[5, 3],
[9, 9],
[1, 2]]
)
edge_index = torch.tensor(
[[0, 1, 0, 2, 1, 2, 2, 3,3,4],
[1, 0, 2, 0, 2, 1, 3, 2,4,3]]
)
edge_attr = torch.tensor(
[[1],
[1],
[4],
[4],
[2],
[2],
[5],
[5],
[5],
[5]]
)

y = torch.tensor(
[[1],
[0],
[1],
[0],
[0]]
)
graph = Data(x=x, edge_index=edge_index, edge_attr=edge_attr, y=y)
print(graph)

4. 視覺化呈現 visualize graph

(圖片在最下方,方格子好像卡住不能在這插入圖片)

四個點,四個邊的影像,然後雙向連結


小結

到目前為止,我們已經利用 PyTorch 成功建立了圖(graph)結構,並且理解 graph object 能夠包含哪些元素。此外,我們還實現了圖的基礎視覺化展示。當手頭的數據具有這種互聯關係時,我們可以使用這種方法將數據轉換成圖形結構。這不僅包括原始數據的特徵,還能創造出基於連結的新特徵,幫助接下來模型預測提高精準度

方格子 vocus

分享至
成為作者繼續創作的動力吧!
從 Google News 追蹤更多 vocus 的最新精選內容從 Google News 追蹤更多 vocus 的最新精選內容

作者的相關文章

Karen的沙龍 的其他內容

你可能也想看

發表回應

成為會員 後即可發表留言
© 2024 vocus All rights reserved.