從零開始部署LLM-選購顯卡篇

更新於 發佈於 閱讀時間約 5 分鐘

※ 部署私有LLM


為什麼要部署私有 LLM?

  • 資訊安全: 你的公司機密或個人隱私,都能得到妥善保護。
  • 客製化: 你可以根據自己的需求,訓練 LLM,讓它更懂你。
  • 彈性: 你可以隨時調整 LLM 的設定,讓它變得更聰明。


如果您有計劃架設私有 LLM,以下三點需要優先考量:


1. 硬體面-選對顯卡才能跑動大語言模型


  • VRAM 限制

顯卡的VRAM決定了能運行的模型大小與效率,若 GPU VRAM 不足,可能無法運行大模型,導致需要縮減上下文長度或批量大小,進而影響推論結果的品質。

  • 計算資源不足

推論過程中,如果硬體性能無法支撐模型運行(特別是在多步推論或處理長上下文時),可能出現性能瓶頸或結果不穩定。


2. 軟體面-選擇合適的大語言模型


  • 開源模型的特性與限制

某些開源模型(如 LLaMA、GPT-NeoX)專注於特定領域,缺乏廣泛的微調,導致泛用性較差,無法應對多樣化需求。舉例來說,如果是專注於程式設計的語言模型,如果要請他推薦附近有名的餐廳就不太合適。

  • 參數量的影響

模型的參數量直接影響其理解能力和生成品質。例如,參數較小的模型(如 7B 或 13B)通常無法與更大參數的模型競爭。


3. 資料面-模型的知識有時效性


開源模型的知識範圍通常受限於其訓練數據的時效性與領域覆蓋,難以回答最新或專業的問題。如果需要不斷更新資料,就會需要運用RAG、Finetune技術調整您的語言模型。

raw-image


顯卡的名詞解釋


  • 名詞解釋
    • VRAM: 想像一下 VRAM 是顯卡的記憶體,就像書桌一樣。VRAM 越大,顯卡能存的資料就越多,LLM 就越聰明。
    • CUDA 核心: CUDA 核心就像是顯卡裡的小小工人,負責處理計算任務。CUDA 核心越多,計算速度就越快。
    • NVLink: 提供高帶寬、低延遲的 GPU 互聯技術,允許多顯卡共享 VRAM,加速大規模計算。
    • 從擴充性的角度,應該選擇支援NVLink的顯卡,因為NVLink能夠提供比PCIe更高的頻寬和更低的延遲,使得多個GPU之間的數據傳輸更加高效,從而大幅提升計算性能。


※ 著名顯卡介紹

NVIDIA A6000:

  • 優勢提供 48GB VRAM,支持 NVLink,功耗相對較低,適合長時間運行與專業應用。
  • 劣勢:售價較高,台灣售價約18萬。
  • 適用場景 適合企業級用戶或需要處理大規模模型的專業人士。


NVIDIA RTX 5090:

  • 優勢:擁有 32GB VRAM 和 21,760 個 CUDA 核心,效能極高,適合需要大量計算的深度學習任務。
  • 劣勢功耗高達 600W,可能需要更強的電源和散熱解決方案。
  • 適用場景預算充足、追求頂級效能的客戶。


NVIDIA RTX 4090:

  • 優勢24GB VRAM和 16,384 個 CUDA 核心,性能强大,價格相對較低。
  • 劣勢不支持 NVLink,VRAM可能不足以處理超大規模模型。
  • 適用場景 適合個人開發者或小型團隊進行小規模的模型訓練。


「番外篇」Project DIGITS 超強微型電腦

  • 2025年1月 CES剛發表,預計於五月開始發售,預期價格 US$3000 起跳。
  • 使用GB10 Grace Blackwell超級晶片,128GB DDR5X,預計可以執行200B超大模型,若兩部機器使用NVIDIA ConnectX連接,則可執行405B的大模型!
  • 這款可說是針對AI程式開發者而打造的超強電腦!


※ 結論:

  • 對企業級用戶來說,若要捨棄外部的 LLM 服務,使用自有的LLM,其推論品質就相當重要,在預算充足的情況下,適合多買幾張A6000,並使用 NVLink 共享VRAM,在高算力的狀況下,可以直接選用大參數LLM、拉大上下文長度、批量大小,有助於提升推論的品質。
  • 如果能解決散熱問題,且預算約八萬的用戶,NVIDIA RTX 5090 也是一個值得考慮的選項,其 24GB VRAM約可處理6~13B的語言模型。
  • 對於預算有限且需求較小的用戶,NVIDIA RTX 4090 提供了良好的性能和性價比。其 24GB VRAM約可處理6~10B的語言模型。
  • 若不考慮遊戲用途,未來開發者最好的選擇應該是Project DIGITS系列的個人電腦!




avatar-img
149會員
51內容數
本專題主要放一些投資理財方面的個人研究,投資理念偏向價值投資,習慣從產業的角度、產品營收佔比分析公司體質,近期研究的主題著重於: (1)半導體產業鏈:IC設計、IC製造、CoWos (2)重電產業鏈:台電強韌電網、智慧電網計畫 (3)營建股追蹤:隆大、新美齊、憶聲、順達、名軒
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
EMO先生的沙龍 的其他內容
隆大建設於2024年房市表現分析,探討其先建後售策略在央行第七波房市管制政策下所面臨的挑戰與機遇。文章分析高雄房市基本面,包含臺積電、輝達投資帶來的剛性需求,以及政策對投資型買盤的抑制。並深入探討隆大建設的財務狀況、銷售策略與未來展望,提醒投資者需關注其銷售狀況及市場接受度。
企業開始利用AI Agent 來解決實際問題。Palantir 的 AIP 平臺展示瞭如何整合生成式 AI 和大規模語言模型,以提升企業的流程優化。透過客製化戰情中心、工作流程排程器及語意搜尋等功能,AIP 能有效助力企業提升生產力並改善管理效率。未來,AI 將在各行各業中扮演更加關鍵的角色。
本文分享了在營建股投資中的個人經歷及策略,包括由國建轉投新美齊的原因,強調資金分配、保持現金水位及避免過度曝險於單一類股的必要性。文章也反映出在面對市場波動時應有的心態與反思,助投資者在經濟不穩定中尋找機會。
本文深入探討2024年央行第七波信用管制的修正重點,分析其對房市的影響。新規定將限制購屋貸款成數,並預測市場參與者的應對策略,包括資金調配和購屋形態的變化。投資客、首次購屋者和預售屋投資客的不同盤算,以及央行意圖減緩市場熱度的解讀,對於未來房市走向提供了重要的見解。
本篇紀錄記憶體產業的近況及未來發展趨勢。首先介紹市場話題,關於利基型記憶體的機會及風險。接著回顧三大原廠減產NAND帶來的影響,以及對記憶體產業鏈的分析。最後,重點介紹了兩家公司:宜鼎及安提國際,探討它們在記憶體產業和AI領域的表現與未來展望。
2024/06臺股大盤本益比24.4,宏璟(2537)是一隻值得關注的防禦型營建股。文章介紹了宏璟的多項廠辦及指標案件,展現其防守和攻擊的兩面功能。同時,宏璟的盈餘分配率也一直保持在較高水平,未來有望帶來更可觀的股息。
隆大建設於2024年房市表現分析,探討其先建後售策略在央行第七波房市管制政策下所面臨的挑戰與機遇。文章分析高雄房市基本面,包含臺積電、輝達投資帶來的剛性需求,以及政策對投資型買盤的抑制。並深入探討隆大建設的財務狀況、銷售策略與未來展望,提醒投資者需關注其銷售狀況及市場接受度。
企業開始利用AI Agent 來解決實際問題。Palantir 的 AIP 平臺展示瞭如何整合生成式 AI 和大規模語言模型,以提升企業的流程優化。透過客製化戰情中心、工作流程排程器及語意搜尋等功能,AIP 能有效助力企業提升生產力並改善管理效率。未來,AI 將在各行各業中扮演更加關鍵的角色。
本文分享了在營建股投資中的個人經歷及策略,包括由國建轉投新美齊的原因,強調資金分配、保持現金水位及避免過度曝險於單一類股的必要性。文章也反映出在面對市場波動時應有的心態與反思,助投資者在經濟不穩定中尋找機會。
本文深入探討2024年央行第七波信用管制的修正重點,分析其對房市的影響。新規定將限制購屋貸款成數,並預測市場參與者的應對策略,包括資金調配和購屋形態的變化。投資客、首次購屋者和預售屋投資客的不同盤算,以及央行意圖減緩市場熱度的解讀,對於未來房市走向提供了重要的見解。
本篇紀錄記憶體產業的近況及未來發展趨勢。首先介紹市場話題,關於利基型記憶體的機會及風險。接著回顧三大原廠減產NAND帶來的影響,以及對記憶體產業鏈的分析。最後,重點介紹了兩家公司:宜鼎及安提國際,探討它們在記憶體產業和AI領域的表現與未來展望。
2024/06臺股大盤本益比24.4,宏璟(2537)是一隻值得關注的防禦型營建股。文章介紹了宏璟的多項廠辦及指標案件,展現其防守和攻擊的兩面功能。同時,宏璟的盈餘分配率也一直保持在較高水平,未來有望帶來更可觀的股息。
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
隨著近年來的AI浪潮,讓大家普遍對於AI後續的發展充滿了期待。今年所舉辦的台北電腦展 (Computex),讓這樣的相關的討論更加熱烈。有在投資的讀者們或多或少都會看到相關產業鏈的梳理,像是AI伺服器需要什麼奈米的晶圓製程、需要那些先進封裝測試技術、需要什麼樣的水冷技術、哪些的OEM廠 (O
Thumbnail
NVIDIA(英偉達)作為全球領先的圖形處理器(GPU)製造商,不僅在遊戲市場佔有重要地位,還在專業圖形和高性能計算領域擁有強大的產品線。
Thumbnail
NVIDIA的新目標是成為支援企業開發AI應用程式的「AI晶圓代工」,提供技術、專業知識和基礎設施,幫助實現AI應用。具體而言,NVIDIA將提供GPU、自主CPU「Grace」、超級計算機及其硬體,還有軟體和工具,以滿足客戶需求。
Thumbnail
這篇文章探討了NVIDIA在推論式AI半導體市場的挑戰,以及介紹了Intel在AI領域的強化舉措。文章中提到了新興企業可能有機會取代現有市場領導者,並討論了RISC-V技術在AI半導體市場的應用和其他相關動向。
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
根據高盛最近的研究報告,未來的個人電腦和移動設備將搭載更多由AI增強後的應用程式,如AI增強、安全性提升和運算能力強化。 消費性電子股票組合<GSXUPCAI>也顯示出潛力,並列出了成分股以及其權重。
Thumbnail
AI PC 硬體 + AI OS + AI PC 摘要
Thumbnail
NVIDIA的Blackwell計算平台代表著實時生成式AI應用的重大進步,旨在滿足跨行業挑戰。此平台提升了計算效能,促進了AI在實體世界的應用,並對從自動駕駛到醫療診斷等多個領域產生了深遠影響。NVIDIA 黃仁勳的願景是將AI技術從虛擬世界帶入現實,為創新開闢新道路,一個更加智慧和互聯的未來。
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
隨著近年來的AI浪潮,讓大家普遍對於AI後續的發展充滿了期待。今年所舉辦的台北電腦展 (Computex),讓這樣的相關的討論更加熱烈。有在投資的讀者們或多或少都會看到相關產業鏈的梳理,像是AI伺服器需要什麼奈米的晶圓製程、需要那些先進封裝測試技術、需要什麼樣的水冷技術、哪些的OEM廠 (O
Thumbnail
NVIDIA(英偉達)作為全球領先的圖形處理器(GPU)製造商,不僅在遊戲市場佔有重要地位,還在專業圖形和高性能計算領域擁有強大的產品線。
Thumbnail
NVIDIA的新目標是成為支援企業開發AI應用程式的「AI晶圓代工」,提供技術、專業知識和基礎設施,幫助實現AI應用。具體而言,NVIDIA將提供GPU、自主CPU「Grace」、超級計算機及其硬體,還有軟體和工具,以滿足客戶需求。
Thumbnail
這篇文章探討了NVIDIA在推論式AI半導體市場的挑戰,以及介紹了Intel在AI領域的強化舉措。文章中提到了新興企業可能有機會取代現有市場領導者,並討論了RISC-V技術在AI半導體市場的應用和其他相關動向。
Thumbnail
科技巨擘聯手推進生成式AI發展 開創人工智慧新時代 在生成式人工智慧(Generative AI)的浪潮中,雲端運算龍頭AWS和晶片巨擘NVIDIA攜手合作,推出一系列革命性的基礎設施、軟體和服務。
Thumbnail
根據高盛最近的研究報告,未來的個人電腦和移動設備將搭載更多由AI增強後的應用程式,如AI增強、安全性提升和運算能力強化。 消費性電子股票組合<GSXUPCAI>也顯示出潛力,並列出了成分股以及其權重。
Thumbnail
AI PC 硬體 + AI OS + AI PC 摘要
Thumbnail
NVIDIA的Blackwell計算平台代表著實時生成式AI應用的重大進步,旨在滿足跨行業挑戰。此平台提升了計算效能,促進了AI在實體世界的應用,並對從自動駕駛到醫療診斷等多個領域產生了深遠影響。NVIDIA 黃仁勳的願景是將AI技術從虛擬世界帶入現實,為創新開闢新道路,一個更加智慧和互聯的未來。