SETTING GPU SHAREING by Bitfusion Server (V100)

更新於 2024/07/09閱讀時間約 7 分鐘

GPU在ESXI的使用有三種方式: 直通、vGPU、Bitfusion。各有優缺點,簡單講: 直通,與裝在單機意思雷同,一張卡片只能給一台VM使用; vGPU可以單卡分享給不同的vm使用,但需要取得nVidia的授權;bitfusion可以把所有GPU集中成一個大水庫,供需要的VM使用。

在bitfusion的硬體支援清單中有詳細的支援列表,我用一句話說明: 如果你拿到的GPU卡片是被動式散熱(就是沒有風扇)的方式,那麼有99%機會他是支援的。如果有風扇,那你要看我另外一篇文章會介紹如何使用。

一開始,先把硬體條件先準備好。在BIOS設定中,我們需要專注在: Above 4G decoding、Memory mapped I/O above 4GB 或 PCI 64-bit resource handing above 4G這些項目。

raw-image

接著要在ESXI設定GPU傳遞方式,在畫面中點選主機\設定\硬體\PCI裝置在裝置名稱打入(本例為V100)搜尋出GPU

raw-image

點選該GPU後\點選切換傳遞,切換成功後要重新開啟ESXI HOST。

raw-image


部署Bitfusion Server請選擇部署OVF範本。此處以bitfusion-server-4.5.4–6.ova為例,請自行到vmware的官方網站申請試用下載。


raw-image
raw-image
raw-image
raw-image
raw-image
raw-image

自訂範本需設置hostname名稱、你要掛載的vCenter Server實例中的用戶和密碼。在 Bitfusion vCenter Server TLS 證書指紋則是可以在vcenter取得相關資訊填入。取得方式參考:

1. Use SSH to connect to the vCenter Server Appliance or ESXi host as root user.

$ ssh root@vcsa_or_esxi_host_address

2. Use openssl to view the certificate fingerprint.

o vCenter Server Appliance:openssl x509 -in /etc/vmware-vpx/ssl/rui.crt -fingerprint -sha1 -noout

o ESXi host:openssl x509 -in /etc/vmware/ssl/rui.crt -fingerprint -sha1 -noout

3. Copy the certificate thumbprint for use in the --thumbprint option of vic-machine commands or to set it as an environment variable.


raw-image
Thumbprint可以在vcenter憑證處取得後填入(這可以事後增加,不知道可以繼續裝)

Thumbprint可以在vcenter憑證處取得後填入(這可以事後增加,不知道可以繼續裝)


客戶端密碼設定雖然不是必需的,但建議設定,方便日後變更相關設定(包括取得nVIDIA DRIVER)。部署完成後,如有需要,可以使用客戶使用者帳戶(customer)通過控制台 shell 或 SSH 登錄到 vCenter Server Appliance。

建議設定customer的密碼,方便日後管理。

建議設定customer的密碼,方便日後管理。


在 NVIDIA packages部分,建議勾選讓Bitfusion 於安裝時下載並安裝 NVIDIA 驅動程式、CUDA 、NVIDIA Fabric Manager等等等相關程式庫。如果你的環境無法上網,我建議讓機器可以上網再安裝,這可以省卻許多麻煩。如果你真的需要手動裝驅動,我建議你看到這邊可以放棄,不要再深挖了。

建議勾選安裝

建議勾選安裝

設定網路時必須注意第一張卡片必須可以用於管理和資料流量。至於234的選項,如果你的網路資源夠多,可以依據需要進行設定。(倘若你需要設定,必須在裝好bitfusion後立即到新增硬體把網路卡加入三片新卡,不然會馬上錯誤)


raw-image
raw-image

到這邊,恭喜你。只需等待它裝好即可。接著,我們要打開bitfusion server新增GPU(按一下新增裝置,從下拉式功能表中的其他裝置,選擇 PCI 裝置。)


raw-image
選擇哪個都可以,依據爽度來決定吧。

選擇哪個都可以,依據爽度來決定吧。


接著設定記憶體大小,這邊要將最小記憶體值指定為匯總 GPU 卡記憶體的 1.5 倍或 32 GB(取較大者),並且保留完整記憶體給Server。


一定要把所有記憶體保留給伺服器

一定要把所有記憶體保留給伺服器

如果沒問題就把伺服器開機吧!


raw-image
成功後會看到bitfusion的外掛

成功後會看到bitfusion的外掛


如果你要集群(cluster)更多的GPU資源,可以安裝更多額外的bitfusion server。


這條線之前是bitfusion server的安裝。


底下開始是bitfusion client的安裝與簡易測試。


接著我們要安裝客體作業系統(此處以ubuntu22.04為例),安裝好後,開機客體,取得相關程序(僅舉例,請依據真實的版本進行所有對應,否則將因沒有錯誤訊務卻無法使用,難以debug)。

wget https://packages.vmware.com/bitfusion/ubuntu/22.04/bitfusion-client-ubuntu2204_4.5.4-6_amd64.deb
sudo apt install ./bitfusion-client-ubuntu2204_4.5.2-16_amd64.deb
shutdown
完成上面步驟,進行啟動。

完成上面步驟,進行啟動。

開啟虛擬機客體,進行配置。

sudo usermod -aG bitfusion username

sudo bitfusion list_gpus
看到這個畫面就恭喜啦! 灑花啦~

看到這個畫面就恭喜啦! 灑花啦~

如果你不放心就做幾個測試:

Bitfusion list_gpus
raw-image
bitfusion health
raw-image
bitfusion smi
raw-image


直通參考這邊:







avatar-img
5會員
75內容數
記錄生活與技術的小細節
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
iBonnie_愛邦尼 的其他內容
將使用者加入Docker群組 sudo groupadd docker sudo usermod -aG docker $USER 設定開機自動啟動Docker服務 sudo systemctl enable docker sudo systemctl start docker 試跑
Docker_ubuntu22.04_安裝
進到管理介面更新就完成了……..沒甚麼可以多說的。
VCENTER_8_新增NAS磁碟機
到存放虛擬機的磁碟處\點選想要註冊的機器\註冊機器(登錄虛擬機器)
將使用者加入Docker群組 sudo groupadd docker sudo usermod -aG docker $USER 設定開機自動啟動Docker服務 sudo systemctl enable docker sudo systemctl start docker 試跑
Docker_ubuntu22.04_安裝
進到管理介面更新就完成了……..沒甚麼可以多說的。
VCENTER_8_新增NAS磁碟機
到存放虛擬機的磁碟處\點選想要註冊的機器\註冊機器(登錄虛擬機器)
你可能也想看
Google News 追蹤
Thumbnail
本文探討了複利效應的重要性,並藉由巴菲特的投資理念,說明如何選擇穩定產生正報酬的資產及長期持有的核心理念。透過定期定額的投資方式,不僅能減少情緒影響,還能持續參與全球股市的發展。此外,文中介紹了使用國泰 Cube App 的便利性及低手續費,幫助投資者簡化投資流程,達成長期穩定增長的財務目標。
請分析以下句子 根據五大句型 以及各種子句文法盡量詳細說明 Children sitting in baskets are lifted high into the sky by an enormous wheel. 這句話 "Children sitting in baskets are l
Thumbnail
以下資訊來自股癌粉專資訊 https://www.facebook.com/Gooaye Alibaba 今天傳出一份 NV 的 spec,符合預期全部低空飛過最新 TPP/PD 禁令 HGX H20 96GB HBM3 GPU memory bandwidth 4T/s 400W
Thumbnail
Recently, I add some useful settings for my nginx web server. I would like to take a note of some basic and useful settings of nginx. http server
Thumbnail
性簡訊也可能是性霸凌的一種形式,兒童被要求將圖片傳送給男朋友/女朋友/ 同儕,而後者在未獲得同意的情況下再將這些圖片散布至同儕網絡中。
Thumbnail
Empirical communication studies in the digital era: Agenda-setting閱讀心得與評述 The dynamics of public attention: Agenda-setting theory meets big data
Thumbnail
靈氣在臨床醫療中正在興起 Reiki in the Clinical Setting is On The Rise 從醫院到收容所,靈氣進入了許多的醫療與護理機構,而且這種推動力來於自患者和臨床從業人員。 “越來越多的患者要求的護理服務超出了大多數人認為的傳統醫療服務的範圍,醫院正在通過提供這些療
Thumbnail
讀國外原文書,你可能會看到「in a domestic setting」這句讓人困惑的英文,是「國內的(domestic)設定(setting)」嗎?痾,那是什麼鬼?查網路會發現國內幾乎沒什麼人解釋這句話,所以我打算做個徹底調查。(可以算是我的獨家嗎~笑)
Thumbnail
「你想跟我一起去滿洲里嗎?去看動物園裡那隻大象。聽說,它就一直坐在那裡,他媽的,它就一直坐在那兒。」
Thumbnail
轉移自 LogDown 原文日期 April 17, 2017 15:39  聽說最近很火的 OneSignal 推播服務,筆者也下載來玩了。 初始設定真的非常簡單,不用另外新增 Service 和 Reciever ,讓筆者想起當初 Push 的痛。 官方教學其實也滿清楚的,有用過其他推播服務或
Thumbnail
故事由滿州里的大象開始,于城聽說、老翁聽說,韋布聽說。滿州里的動物園裡有頭大象,整天坐在那裏。翻到了一篇中國的影評,說著大象這種動物基本上是不坐著的,他們整天站著,要是坐著,那麼是內在的甚麼破裂了,不然不可能坐得住。
Thumbnail
本文探討了複利效應的重要性,並藉由巴菲特的投資理念,說明如何選擇穩定產生正報酬的資產及長期持有的核心理念。透過定期定額的投資方式,不僅能減少情緒影響,還能持續參與全球股市的發展。此外,文中介紹了使用國泰 Cube App 的便利性及低手續費,幫助投資者簡化投資流程,達成長期穩定增長的財務目標。
請分析以下句子 根據五大句型 以及各種子句文法盡量詳細說明 Children sitting in baskets are lifted high into the sky by an enormous wheel. 這句話 "Children sitting in baskets are l
Thumbnail
以下資訊來自股癌粉專資訊 https://www.facebook.com/Gooaye Alibaba 今天傳出一份 NV 的 spec,符合預期全部低空飛過最新 TPP/PD 禁令 HGX H20 96GB HBM3 GPU memory bandwidth 4T/s 400W
Thumbnail
Recently, I add some useful settings for my nginx web server. I would like to take a note of some basic and useful settings of nginx. http server
Thumbnail
性簡訊也可能是性霸凌的一種形式,兒童被要求將圖片傳送給男朋友/女朋友/ 同儕,而後者在未獲得同意的情況下再將這些圖片散布至同儕網絡中。
Thumbnail
Empirical communication studies in the digital era: Agenda-setting閱讀心得與評述 The dynamics of public attention: Agenda-setting theory meets big data
Thumbnail
靈氣在臨床醫療中正在興起 Reiki in the Clinical Setting is On The Rise 從醫院到收容所,靈氣進入了許多的醫療與護理機構,而且這種推動力來於自患者和臨床從業人員。 “越來越多的患者要求的護理服務超出了大多數人認為的傳統醫療服務的範圍,醫院正在通過提供這些療
Thumbnail
讀國外原文書,你可能會看到「in a domestic setting」這句讓人困惑的英文,是「國內的(domestic)設定(setting)」嗎?痾,那是什麼鬼?查網路會發現國內幾乎沒什麼人解釋這句話,所以我打算做個徹底調查。(可以算是我的獨家嗎~笑)
Thumbnail
「你想跟我一起去滿洲里嗎?去看動物園裡那隻大象。聽說,它就一直坐在那裡,他媽的,它就一直坐在那兒。」
Thumbnail
轉移自 LogDown 原文日期 April 17, 2017 15:39  聽說最近很火的 OneSignal 推播服務,筆者也下載來玩了。 初始設定真的非常簡單,不用另外新增 Service 和 Reciever ,讓筆者想起當初 Push 的痛。 官方教學其實也滿清楚的,有用過其他推播服務或
Thumbnail
故事由滿州里的大象開始,于城聽說、老翁聽說,韋布聽說。滿州里的動物園裡有頭大象,整天坐在那裏。翻到了一篇中國的影評,說著大象這種動物基本上是不坐著的,他們整天站著,要是坐著,那麼是內在的甚麼破裂了,不然不可能坐得住。