GPU在ESXI的使用有三種方式: 直通、vGPU、Bitfusion。各有優缺點,簡單講: 直通,與裝在單機意思雷同,一張卡片只能給一台VM使用; vGPU可以單卡分享給不同的vm使用,但需要取得nVidia的授權;bitfusion可以把所有GPU集中成一個大水庫,供需要的VM使用。
這篇就來講講怎麼設定一個直通的GPU服務給ubuntu 22.04使用的例子。本篇雖以ESXI8-Ubuntu22.04 GPU 直通_GPU passthru, esxi 8.0 — Ubuntu 22.04為例,但Linux 都可以 FOR nVidia 計算卡(無輸出,此處以v100為例),不用擔心版本不同,可以繼續往下閱讀。
如果你是要使用有DP、HDMI等等等的卡片(3060 3070 3080 3090 4060 4070 4080 4090)請參考這篇:
直通的觀念就字面上來講就是"直接拿來用",所以不管你是甚麼樣的客體作業系統,或你是不同的ESXI版本,這篇文章通通適用。
GPU直通的架構如下:
開始之前請先準備好Ubuntu 22.04的安裝前準備(經過測試,其他不同的linux版本也都可以的),可以依據您們的喜好架構客體作業系統(這裡不是要安裝好,是在ESXI中選好你要裝客體前的準備程序,等設定好才會用光碟開機進行正式安裝,很重要很重要很重要)。
準備好後,第一個步驟請將GPU裝置到該ESXI主機(在ESXI點選主機\設定\硬體\PCI裝置在裝置名稱打入(本例為V100)搜尋出GPU;點選該GPU後\點選切換傳遞,切換成功後要重新開啟ESXI HOST。)你也可以參考這裡。
緊接著設定虛擬機(客體作業系統),新增其PCI裝置。
並且在進階設定新增:
pciPassthru.use64bitMMIO=TRUE
pciPassthru.64bitMMIOSizeGB=64
正式裝虛擬機的作業系統(這個步驟省略,注意安裝時可以上網(很重要),更新PCI裝置即可成功,請在安裝時選擇第三方軟體安裝以及更新等功能),等待自動安裝成功後,進入系統打入nvidia-smi測試即可成功。
Bitfusion看這邊: