SETTING GPU SHAREING by Bitfusion Server (V100)

iBonnie_愛邦尼-avatar-img
發佈於AI領域/LLM_RAG 個房間
更新 發佈閱讀 7 分鐘

GPU在ESXI的使用有三種方式: 直通、vGPU、Bitfusion。各有優缺點,簡單講: 直通,與裝在單機意思雷同,一張卡片只能給一台VM使用; vGPU可以單卡分享給不同的vm使用,但需要取得nVidia的授權;bitfusion可以把所有GPU集中成一個大水庫,供需要的VM使用。

在bitfusion的硬體支援清單中有詳細的支援列表,我用一句話說明: 如果你拿到的GPU卡片是被動式散熱(就是沒有風扇)的方式,那麼有99%機會他是支援的。如果有風扇,那你要看我另外一篇文章會介紹如何使用。

一開始,先把硬體條件先準備好。在BIOS設定中,我們需要專注在: Above 4G decoding、Memory mapped I/O above 4GB 或 PCI 64-bit resource handing above 4G這些項目。

raw-image

接著要在ESXI設定GPU傳遞方式,在畫面中點選主機\設定\硬體\PCI裝置在裝置名稱打入(本例為V100)搜尋出GPU

raw-image

點選該GPU後\點選切換傳遞,切換成功後要重新開啟ESXI HOST。

raw-image


部署Bitfusion Server請選擇部署OVF範本。此處以bitfusion-server-4.5.4–6.ova為例,請自行到vmware的官方網站申請試用下載。


raw-image
raw-image
raw-image
raw-image
raw-image
raw-image

自訂範本需設置hostname名稱、你要掛載的vCenter Server實例中的用戶和密碼。在 Bitfusion vCenter Server TLS 證書指紋則是可以在vcenter取得相關資訊填入。取得方式參考:

1. Use SSH to connect to the vCenter Server Appliance or ESXi host as root user.

$ ssh root@vcsa_or_esxi_host_address

2. Use openssl to view the certificate fingerprint.

o vCenter Server Appliance:openssl x509 -in /etc/vmware-vpx/ssl/rui.crt -fingerprint -sha1 -noout

o ESXi host:openssl x509 -in /etc/vmware/ssl/rui.crt -fingerprint -sha1 -noout

3. Copy the certificate thumbprint for use in the --thumbprint option of vic-machine commands or to set it as an environment variable.


raw-image
Thumbprint可以在vcenter憑證處取得後填入(這可以事後增加,不知道可以繼續裝)

Thumbprint可以在vcenter憑證處取得後填入(這可以事後增加,不知道可以繼續裝)


客戶端密碼設定雖然不是必需的,但建議設定,方便日後變更相關設定(包括取得nVIDIA DRIVER)。部署完成後,如有需要,可以使用客戶使用者帳戶(customer)通過控制台 shell 或 SSH 登錄到 vCenter Server Appliance。

建議設定customer的密碼,方便日後管理。

建議設定customer的密碼,方便日後管理。


在 NVIDIA packages部分,建議勾選讓Bitfusion 於安裝時下載並安裝 NVIDIA 驅動程式、CUDA 、NVIDIA Fabric Manager等等等相關程式庫。如果你的環境無法上網,我建議讓機器可以上網再安裝,這可以省卻許多麻煩。如果你真的需要手動裝驅動,我建議你看到這邊可以放棄,不要再深挖了。

建議勾選安裝

建議勾選安裝

設定網路時必須注意第一張卡片必須可以用於管理和資料流量。至於234的選項,如果你的網路資源夠多,可以依據需要進行設定。(倘若你需要設定,必須在裝好bitfusion後立即到新增硬體把網路卡加入三片新卡,不然會馬上錯誤)


raw-image
raw-image

到這邊,恭喜你。只需等待它裝好即可。接著,我們要打開bitfusion server新增GPU(按一下新增裝置,從下拉式功能表中的其他裝置,選擇 PCI 裝置。)


raw-image
選擇哪個都可以,依據爽度來決定吧。

選擇哪個都可以,依據爽度來決定吧。


接著設定記憶體大小,這邊要將最小記憶體值指定為匯總 GPU 卡記憶體的 1.5 倍或 32 GB(取較大者),並且保留完整記憶體給Server。


一定要把所有記憶體保留給伺服器

一定要把所有記憶體保留給伺服器

如果沒問題就把伺服器開機吧!


raw-image
成功後會看到bitfusion的外掛

成功後會看到bitfusion的外掛


如果你要集群(cluster)更多的GPU資源,可以安裝更多額外的bitfusion server。


這條線之前是bitfusion server的安裝。


底下開始是bitfusion client的安裝與簡易測試。


接著我們要安裝客體作業系統(此處以ubuntu22.04為例),安裝好後,開機客體,取得相關程序(僅舉例,請依據真實的版本進行所有對應,否則將因沒有錯誤訊務卻無法使用,難以debug)。

wget https://packages.vmware.com/bitfusion/ubuntu/22.04/bitfusion-client-ubuntu2204_4.5.4-6_amd64.deb
sudo apt install ./bitfusion-client-ubuntu2204_4.5.2-16_amd64.deb
shutdown
完成上面步驟,進行啟動。

完成上面步驟,進行啟動。

開啟虛擬機客體,進行配置。

sudo usermod -aG bitfusion username

sudo bitfusion list_gpus
看到這個畫面就恭喜啦! 灑花啦~

看到這個畫面就恭喜啦! 灑花啦~

如果你不放心就做幾個測試:

Bitfusion list_gpus
raw-image
bitfusion health
raw-image
bitfusion smi
raw-image


直通參考這邊:







留言
avatar-img
留言分享你的想法!
avatar-img
iBonnie_愛邦尼
9會員
86內容數
記錄生活與技術的小細節
你可能也想看
Thumbnail
在小小的租屋房間裡,透過蝦皮購物平臺採購各種黏土、模型、美甲材料等創作素材,打造專屬黏土小宇宙的療癒過程。文中分享多個蝦皮挖寶地圖,並推薦蝦皮分潤計畫。
Thumbnail
在小小的租屋房間裡,透過蝦皮購物平臺採購各種黏土、模型、美甲材料等創作素材,打造專屬黏土小宇宙的療癒過程。文中分享多個蝦皮挖寶地圖,並推薦蝦皮分潤計畫。
Thumbnail
小蝸和小豬因購物習慣不同常起衝突,直到發現蝦皮分潤計畫,讓小豬的購物愛好產生價值,也讓小蝸開始欣賞另一半的興趣。想增加收入或改善伴侶間的購物觀念差異?讓蝦皮分潤計畫成為你們的神隊友吧!
Thumbnail
小蝸和小豬因購物習慣不同常起衝突,直到發現蝦皮分潤計畫,讓小豬的購物愛好產生價值,也讓小蝸開始欣賞另一半的興趣。想增加收入或改善伴侶間的購物觀念差異?讓蝦皮分潤計畫成為你們的神隊友吧!
Thumbnail
如果實在找不到可用的替代軟體,或者就是要用指定的軟體不可,那麼虛擬機器可以作為在使用Linux時的一個應對方案。
Thumbnail
如果實在找不到可用的替代軟體,或者就是要用指定的軟體不可,那麼虛擬機器可以作為在使用Linux時的一個應對方案。
Thumbnail
本文將介紹如何安裝CUDA和cuDNN,並提供注意事項。隨著安裝步驟和提示,確保您能成功安裝這些必要的套件。
Thumbnail
本文將介紹如何安裝CUDA和cuDNN,並提供注意事項。隨著安裝步驟和提示,確保您能成功安裝這些必要的套件。
Thumbnail
搜尋.......支援的driver: apt search nvidia-drive 最新支援到545,我們來裝545好了(通常我會選擇前一版,我也建議選前一版,像是python12 我們就選python11) sudo apt install nvidia-driver-545 sudo
Thumbnail
搜尋.......支援的driver: apt search nvidia-drive 最新支援到545,我們來裝545好了(通常我會選擇前一版,我也建議選前一版,像是python12 我們就選python11) sudo apt install nvidia-driver-545 sudo
Thumbnail
新系統建構時,可考慮採購建置VM機器,DB機器,備份機器以及網路設備等硬體機器。
Thumbnail
新系統建構時,可考慮採購建置VM機器,DB機器,備份機器以及網路設備等硬體機器。
Thumbnail
本文介紹了GPU在ESXI上的三種使用方式: 直通、vGPU、Bitfusion。針對一般使用者可以輕易取得的消費者端顯示卡進行了直通的例子和設定步驟。文章詳細介紹了BIOS、 ESXI HOST和虛擬機的設定以及需要注意的各種細節。提供了最新的nvidia驅動下載連結,並分享了測試的方法。
Thumbnail
本文介紹了GPU在ESXI上的三種使用方式: 直通、vGPU、Bitfusion。針對一般使用者可以輕易取得的消費者端顯示卡進行了直通的例子和設定步驟。文章詳細介紹了BIOS、 ESXI HOST和虛擬機的設定以及需要注意的各種細節。提供了最新的nvidia驅動下載連結,並分享了測試的方法。
Thumbnail
這篇文章將分享最近遇到 NVIDIA GPU driver 的問題,並提供瞭解決步驟,以及證實問題解決的測試方法。當您遇到類似問題時,可以參考這篇文章進行解決。文章中包含了定位庫文件目錄、備份和替換文件以及測試修改的步驟。
Thumbnail
這篇文章將分享最近遇到 NVIDIA GPU driver 的問題,並提供瞭解決步驟,以及證實問題解決的測試方法。當您遇到類似問題時,可以參考這篇文章進行解決。文章中包含了定位庫文件目錄、備份和替換文件以及測試修改的步驟。
Thumbnail
GPU在ESXI的使用有三種方式: 直通、vGPU、Bitfusion。各有優缺點,簡單講: 直通,與裝在單機意思雷同,一張卡片只能給一台VM使用; vGPU可以單卡分享給不同的vm使用,但需要取得nVidia的授權;bitfusion可以把所有GPU集中成一個大水庫,供需要的VM使用。
Thumbnail
GPU在ESXI的使用有三種方式: 直通、vGPU、Bitfusion。各有優缺點,簡單講: 直通,與裝在單機意思雷同,一張卡片只能給一台VM使用; vGPU可以單卡分享給不同的vm使用,但需要取得nVidia的授權;bitfusion可以把所有GPU集中成一個大水庫,供需要的VM使用。
Thumbnail
GPU在ESXI的使用有三種方式: 直通、vGPU、Bitfusion。各有優缺點,簡單講: 直通,與裝在單機意思雷同,一張卡片只能給一台VM使用; vGPU可以單卡分享給不同的vm使用,但需要取得nVidia的授權;bitfusion可以把所有GPU集中成一個大水庫,供需要的VM使用。 在bit
Thumbnail
GPU在ESXI的使用有三種方式: 直通、vGPU、Bitfusion。各有優缺點,簡單講: 直通,與裝在單機意思雷同,一張卡片只能給一台VM使用; vGPU可以單卡分享給不同的vm使用,但需要取得nVidia的授權;bitfusion可以把所有GPU集中成一個大水庫,供需要的VM使用。 在bit
Thumbnail
本文介紹如何設定ESXI HOST中的虛擬機自動隨著HOST開關機。
Thumbnail
本文介紹如何設定ESXI HOST中的虛擬機自動隨著HOST開關機。
Thumbnail
這篇文章將介紹在vCenter中新增網路和VMkernel介面的操作步驟,包括進入設定、新增標準交換器群組、命名交換器、觀察狀態、新增VMkernel介面、命名和啟用服務等。
Thumbnail
這篇文章將介紹在vCenter中新增網路和VMkernel介面的操作步驟,包括進入設定、新增標準交換器群組、命名交換器、觀察狀態、新增VMkernel介面、命名和啟用服務等。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News