從零開始部署LLM-選購顯卡篇

更新於 發佈於 閱讀時間約 5 分鐘

※ 部署私有LLM


為什麼要部署私有 LLM?

  • 資訊安全: 你的公司機密或個人隱私,都能得到妥善保護。
  • 客製化: 你可以根據自己的需求,訓練 LLM,讓它更懂你。
  • 彈性: 你可以隨時調整 LLM 的設定,讓它變得更聰明。


如果您有計劃架設私有 LLM,以下三點需要優先考量:


1. 硬體面-選對顯卡才能跑動大語言模型


  • VRAM 限制

顯卡的VRAM決定了能運行的模型大小與效率,若 GPU VRAM 不足,可能無法運行大模型,導致需要縮減上下文長度或批量大小,進而影響推論結果的品質。

  • 計算資源不足

推論過程中,如果硬體性能無法支撐模型運行(特別是在多步推論或處理長上下文時),可能出現性能瓶頸或結果不穩定。


2. 軟體面-選擇合適的大語言模型


  • 開源模型的特性與限制

某些開源模型(如 LLaMA、GPT-NeoX)專注於特定領域,缺乏廣泛的微調,導致泛用性較差,無法應對多樣化需求。舉例來說,如果是專注於程式設計的語言模型,如果要請他推薦附近有名的餐廳就不太合適。

  • 參數量的影響

模型的參數量直接影響其理解能力和生成品質。例如,參數較小的模型(如 7B 或 13B)通常無法與更大參數的模型競爭。


3. 資料面-模型的知識有時效性


開源模型的知識範圍通常受限於其訓練數據的時效性與領域覆蓋,難以回答最新或專業的問題。如果需要不斷更新資料,就會需要運用RAG、Finetune技術調整您的語言模型。

raw-image


顯卡的名詞解釋


  • 名詞解釋
    • VRAM: 想像一下 VRAM 是顯卡的記憶體,就像書桌一樣。VRAM 越大,顯卡能存的資料就越多,LLM 就越聰明。
    • CUDA 核心: CUDA 核心就像是顯卡裡的小小工人,負責處理計算任務。CUDA 核心越多,計算速度就越快。
    • NVLink: 提供高帶寬、低延遲的 GPU 互聯技術,允許多顯卡共享 VRAM,加速大規模計算。
    • 從擴充性的角度,應該選擇支援NVLink的顯卡,因為NVLink能夠提供比PCIe更高的頻寬和更低的延遲,使得多個GPU之間的數據傳輸更加高效,從而大幅提升計算性能。


※ 著名顯卡介紹

NVIDIA A6000:

  • 優勢提供 48GB VRAM,支持 NVLink,功耗相對較低,適合長時間運行與專業應用。
  • 劣勢:售價較高,台灣售價約18萬。
  • 適用場景 適合企業級用戶或需要處理大規模模型的專業人士。


NVIDIA RTX 5090:

  • 優勢:擁有 32GB VRAM 和 21,760 個 CUDA 核心,效能極高,適合需要大量計算的深度學習任務。
  • 劣勢功耗高達 600W,可能需要更強的電源和散熱解決方案。
  • 適用場景預算充足、追求頂級效能的客戶。


NVIDIA RTX 4090:

  • 優勢24GB VRAM和 16,384 個 CUDA 核心,性能强大,價格相對較低。
  • 劣勢不支持 NVLink,VRAM可能不足以處理超大規模模型。
  • 適用場景 適合個人開發者或小型團隊進行小規模的模型訓練。


「番外篇」Project DIGITS 超強微型電腦

  • 2025年1月 CES剛發表,預計於五月開始發售,預期價格 US$3000 起跳。
  • 使用GB10 Grace Blackwell超級晶片,128GB DDR5X,預計可以執行200B超大模型,若兩部機器使用NVIDIA ConnectX連接,則可執行405B的大模型!
  • 這款可說是針對AI程式開發者而打造的超強電腦!


※ 結論:

  • 對企業級用戶來說,若要捨棄外部的 LLM 服務,使用自有的LLM,其推論品質就相當重要,在預算充足的情況下,適合多買幾張A6000,並使用 NVLink 共享VRAM,在高算力的狀況下,可以直接選用大參數LLM、拉大上下文長度、批量大小,有助於提升推論的品質。
  • 如果能解決散熱問題,且預算約八萬的用戶,NVIDIA RTX 5090 也是一個值得考慮的選項,其 24GB VRAM約可處理6~13B的語言模型。
  • 對於預算有限且需求較小的用戶,NVIDIA RTX 4090 提供了良好的性能和性價比。其 24GB VRAM約可處理6~10B的語言模型。
  • 若不考慮遊戲用途,未來開發者最好的選擇應該是Project DIGITS系列的個人電腦!




留言
avatar-img
留言分享你的想法!
avatar-img
EMO先生的沙龍
158會員
64內容數
本專題主要放一些投資理財方面的個人研究,投資理念偏向價值投資,習慣從產業的角度、產品營收佔比分析公司體質,近期研究的主題著重於: (1)半導體產業鏈:IC設計、IC製造、CoWos (2)重電產業鏈:台電強韌電網、智慧電網計畫 (3)營建股追蹤:隆大、新美齊、憶聲、順達、名軒
EMO先生的沙龍的其他內容
2025/02/28
南亞科(2408)股價來到近期波段高點,本文探討其在DDR5、DDR4市場的競爭力,以及在邊緣運算的未來佈局。儘管中國長鑫存儲的崛起帶來競爭壓力,但南亞科可望受惠於轉單效應及高階DDR5高密度模組市場的發展。本文也分析了市場對於南亞科股價的觀望態度,以及其在去庫存化壓力下的挑戰與機會。
Thumbnail
2025/02/28
南亞科(2408)股價來到近期波段高點,本文探討其在DDR5、DDR4市場的競爭力,以及在邊緣運算的未來佈局。儘管中國長鑫存儲的崛起帶來競爭壓力,但南亞科可望受惠於轉單效應及高階DDR5高密度模組市場的發展。本文也分析了市場對於南亞科股價的觀望態度,以及其在去庫存化壓力下的挑戰與機會。
Thumbnail
2025/02/15
聯發科發表Breeze 2繁體中文多模態大語言模型,具備聊天、視覺多模態及工具使用等多元功能,並推出臺灣口音語音合成與Android APP,致力於推廣邊緣運算與NPU技術。群聯電子受惠美國對中國半導體產業的管制政策,因其NAND Flash控制IC設計能力而受惠,股價上漲。
Thumbnail
2025/02/15
聯發科發表Breeze 2繁體中文多模態大語言模型,具備聊天、視覺多模態及工具使用等多元功能,並推出臺灣口音語音合成與Android APP,致力於推廣邊緣運算與NPU技術。群聯電子受惠美國對中國半導體產業的管制政策,因其NAND Flash控制IC設計能力而受惠,股價上漲。
Thumbnail
2025/02/10
聯發科2024年營收創歷史次高,2025年成長動能來自天璣9400/9300系列晶片、AI與邊緣運算、Wi-Fi 7及車用業務。然而,市場預期2025年營收增長放緩,毛利率及獲利成長也將面臨挑戰,需關注晶片代工成本、ARM授權費及營運費用等風險。
Thumbnail
2025/02/10
聯發科2024年營收創歷史次高,2025年成長動能來自天璣9400/9300系列晶片、AI與邊緣運算、Wi-Fi 7及車用業務。然而,市場預期2025年營收增長放緩,毛利率及獲利成長也將面臨挑戰,需關注晶片代工成本、ARM授權費及營運費用等風險。
Thumbnail
看更多
你可能也想看
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
本文探討部署私有LLM的優缺點,並針對硬體、軟體、資料三個面向提供建議。文中比較三種顯卡:NVIDIA RTX 5090、RTX 4090和A6000,分析其優劣勢及適用場景,最後針對不同預算和需求的用戶提供選購建議。
Thumbnail
本文探討部署私有LLM的優缺點,並針對硬體、軟體、資料三個面向提供建議。文中比較三種顯卡:NVIDIA RTX 5090、RTX 4090和A6000,分析其優劣勢及適用場景,最後針對不同預算和需求的用戶提供選購建議。
Thumbnail
AI PC 是將 AI 模型與傳統 PC 緊密結合的裝置,為本地 AI 運算能力,更能保護用戶的隱私和數據安全。 AI PC 具有 NPU、CPU 以及 GPU,並能夠具備高算力 AI 應用的需求,在 AI 運算性能、效率跟功耗方面,NPU 相較 CPU 與 GPU 具有大幅優勢。
Thumbnail
AI PC 是將 AI 模型與傳統 PC 緊密結合的裝置,為本地 AI 運算能力,更能保護用戶的隱私和數據安全。 AI PC 具有 NPU、CPU 以及 GPU,並能夠具備高算力 AI 應用的需求,在 AI 運算性能、效率跟功耗方面,NPU 相較 CPU 與 GPU 具有大幅優勢。
Thumbnail
NVIDIA、Intel、Tenstorrent和RISC-V在AI半導體領域的競爭和合作。Intel在AI領域推出了一系列產品,Tenstorrent和Rapidus合作開發新技術,而RISC-V開放源碼指令集架構也受到了廣泛關注。這些內容都展示了AI半導體市場的技術革新和競爭激烈的情況。
Thumbnail
NVIDIA、Intel、Tenstorrent和RISC-V在AI半導體領域的競爭和合作。Intel在AI領域推出了一系列產品,Tenstorrent和Rapidus合作開發新技術,而RISC-V開放源碼指令集架構也受到了廣泛關注。這些內容都展示了AI半導體市場的技術革新和競爭激烈的情況。
Thumbnail
這篇文章探討了NVIDIA在推論式AI半導體市場的挑戰,以及介紹了Intel在AI領域的強化舉措。文章中提到了新興企業可能有機會取代現有市場領導者,並討論了RISC-V技術在AI半導體市場的應用和其他相關動向。
Thumbnail
這篇文章探討了NVIDIA在推論式AI半導體市場的挑戰,以及介紹了Intel在AI領域的強化舉措。文章中提到了新興企業可能有機會取代現有市場領導者,並討論了RISC-V技術在AI半導體市場的應用和其他相關動向。
Thumbnail
這是我最近在『網路安全停看聽』Podcast企劃的一集,文末會提供podcast單集連結,想讓眼睛休息的格友們也可點選收聽喔! 今年NVIDIA輝達這家公司在世界掀起了旋風,不管你之前有沒有購買這家公司的股票,當執行長黃仁勳先生訪台,台灣各家媒體爭相報導下,你總應該注意到這家厲害的公司了。Go
Thumbnail
這是我最近在『網路安全停看聽』Podcast企劃的一集,文末會提供podcast單集連結,想讓眼睛休息的格友們也可點選收聽喔! 今年NVIDIA輝達這家公司在世界掀起了旋風,不管你之前有沒有購買這家公司的股票,當執行長黃仁勳先生訪台,台灣各家媒體爭相報導下,你總應該注意到這家厲害的公司了。Go
Thumbnail
GPU,既能支援大規模人工智慧計算,現在也能夠支援一些量子軟體,各家公司都在密切關注這個發展趨勢。 GPU已經改變了人工智慧的格局,現在也準備投身量子計算領域,儘管量子技術尚未成熟,但許多公司已經找到可以在與人工智慧相同的晶片上,運行複雜的量子演算法。近年來,由於GPU和其他先進晶片提供的計算
Thumbnail
GPU,既能支援大規模人工智慧計算,現在也能夠支援一些量子軟體,各家公司都在密切關注這個發展趨勢。 GPU已經改變了人工智慧的格局,現在也準備投身量子計算領域,儘管量子技術尚未成熟,但許多公司已經找到可以在與人工智慧相同的晶片上,運行複雜的量子演算法。近年來,由於GPU和其他先進晶片提供的計算
Thumbnail
如果這篇文章裡面的內容都已經price in了,僅供想了解產業及科技的人參考。不構成任何投資建議。 未來趨勢 CoWoS 已經外包了。 CoWoS 有幾種變體,但原始 CoWoS-S 仍然是大批量生產中的唯一配置。這是如上所述的經典配置:邏輯芯片 + HBM 芯片通過帶有 TSV 的矽基中介層
Thumbnail
如果這篇文章裡面的內容都已經price in了,僅供想了解產業及科技的人參考。不構成任何投資建議。 未來趨勢 CoWoS 已經外包了。 CoWoS 有幾種變體,但原始 CoWoS-S 仍然是大批量生產中的唯一配置。這是如上所述的經典配置:邏輯芯片 + HBM 芯片通過帶有 TSV 的矽基中介層
Thumbnail
AMD挑戰NVIDIA的AI晶片大戰 今天要跟大家分享一個發生在舊金山的AMD全球發表會,其中最吸引人的新品就是Instinct MI300系列的AI晶片,這是AMD為了挑戰NVIDIA在AI領域的霸主地位而推出的產品,具有高效能、高記憶體容量和高記憶體頻寬等特點,尤其針對生成式AI的應用
Thumbnail
AMD挑戰NVIDIA的AI晶片大戰 今天要跟大家分享一個發生在舊金山的AMD全球發表會,其中最吸引人的新品就是Instinct MI300系列的AI晶片,這是AMD為了挑戰NVIDIA在AI領域的霸主地位而推出的產品,具有高效能、高記憶體容量和高記憶體頻寬等特點,尤其針對生成式AI的應用
Thumbnail
AI技術的發展為人們的生產和生活帶來了巨大的變革,從智能家居、智能醫療、自動駕駛等,現在AI已經漸漸地出現在你的生活中,如果未來AI會更盛行的,我們可以從中找到甚麼投資機會 那以下就要稍微介紹一下AI,但因為菜鳥也是自己去爬文,去找資料,不是相關的專業人士,所以僅供參考就好了,那AI也有蠻多法規跟倫
Thumbnail
AI技術的發展為人們的生產和生活帶來了巨大的變革,從智能家居、智能醫療、自動駕駛等,現在AI已經漸漸地出現在你的生活中,如果未來AI會更盛行的,我們可以從中找到甚麼投資機會 那以下就要稍微介紹一下AI,但因為菜鳥也是自己去爬文,去找資料,不是相關的專業人士,所以僅供參考就好了,那AI也有蠻多法規跟倫
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News