付費限定

你沒聽過的 Nvidia AI 晶片的挑戰者Cerebras要IPO了

閱讀時間約 15 分鐘
raw-image


Cerebras Systems:AI 晶片界的新星

在人工智慧(AI)技術快速發展的今天,一家你可能從未聽說過的公司正準備在華爾街亮相。這家名為Cerebras Systems的公司,正計劃通過IPO進入資本市場,分食NVIDIA在AI晶片市場的大餅。成立於2016年的Cerebras Systems,憑藉其獨特的晶圓級引擎(Wafer-Scale Engine,WSE)技術,正在另闢蹊徑找到自己的市場。

Cerebras Systems的CEO Andrew Feldman在最近的一次訪談中表示:

「我們展示了我們的AI推理能力,我們現在在推理方面是世界上最快的。在最高精度水平上,我們是最便宜的。」



Cerebras想解決的核心問題

  1. 大規模AI模型的訓練效率:傳統GPU在處理大型AI模型時面臨著嚴重的限制。例如,訓練像GPT-3這樣的模型,需要將其分割並分佈到數百或數千個GPU上,這導致了極大的通訊開銷和programming複雜性。
  2. 推理速度和延遲:在進行生成式推理時,完整的模型需要為每個生成的詞運行一次。由於大型模型超出了GPU的片上記憶體容量,這需要頻繁地在片外記憶體之間移動數據,導致效率低下和高延遲。
  3. 能源效率:傳統的GPU集群在處理AI工作負載時消耗大量能源,特別是在數據移動方面。
  4. Programming複雜性:開發人員需要管理複雜的並行策略和大量程式碼,才能在GPU集群上有效地運行大型AI模型。
  5. 擴展性挑戰:隨著AI模型規模的增長,擴展GPU集群變得越來越困難和昂貴
raw-image


Cerebras的解決方案

為了應對這些挑戰,Cerebras開發了一系列創新技術和解決方案:

  • 晶圓級引擎(Wafer-Scale Engine, WSE):

Cerebras Systems的核心競爭力來自其革命性的晶圓級引擎技術。該公司的第三代WSE(WSE-3)是目前市面上最大的晶片,其尺寸是領先的NVIDIA H100 GPU的57倍。WSE-3擁有9,000億個電晶體,這一數字超過了摩爾定律預測的2034年才能達到的水平。

raw-image


WSE-3配備了 52 倍於領先 GPU 的運算核心,總計 900,000 個核心。此外,它還具有 880 倍的片上記憶體(44 GB)和 7,000 倍的記憶體頻寬(每秒 21 PB)。

值得注意的是,Cerebras採用了與NVIDIA類似的策略,選擇台積電(TSMC)作為其晶圓代工夥伴。這種合作關係使Cerebras能夠利用台積電的尖端製程技術,生產出其革命性的晶圓級引擎。

這種規模的晶片為AI運算帶來了顯著優勢。首先,它能夠在單一晶片上執行甚至是最大規模的AI模型,避免了將模型分割到多個處理器上的複雜性。其次,WSE的龐大片上記憶體和超高記憶體頻寬大大減少了數據移動的需求,從而提高了效能並降低了功耗。最後,WSE-3的架構原生支持稀疏性加速,能夠跳過不必要的零值計算,進一步提升性能和能源效率。

  • CS-3系統:這是一個集成了WSE的AI計算系統,提供創新的供電和冷卻解決方案。CS-3的計算能力每單位功耗比領先的8路GPU系統高出3倍。
raw-image


  • Cerebras AI Supercomputer 超級電腦:這個系統可以無縫地擴展至2,048個CS-3系統,提供近乎線性的性能提升,而無需複雜的分佈式programming。
  • CSoft軟體平台:這是Cerebras的專有軟體平台,與PyTorch等標準ML框架無縫集成,消除了對CUDA等 low-level programming的需求。
  • Cerebras Inference Serving Stack:專門設計用於快速部署大型GenAI模型,提供業界領先的Inference推理速度。
  • AI模型服務:Cerebras提供AI專家團隊協助客戶用最快速度設計研究實驗、訓練模型和優化流程服務,幫助客戶從AI快速且高效的 AI 開發和部署,從AI投資中獲得最大價值。

性能優勢:訓練和推理的革命

根據Cerebras Systems的說法,許多客戶報告稱,使用其解決方案進行AI模型訓練的速度比同代領先的8路GPU系統快10倍以上。在推理方面,Cerebras聲稱其解決方案的輸出生成速度,比頂級雲服務提供商的基於GPU的解決方案快10倍以上。

Andrew Feldman在訪談中具體解釋了他們在推理方面的優勢:

「如果你比較我們與你可以從Nvidia H100在Azure上獲得的性能,我們快20倍。對於像llama 3.1 8B和70B這樣的最流行模型,我們正在提供GPU無法達到的速度。」

raw-image


這種性能優勢源於Cerebras獨特的技術方法。例如,在訓練大型AI模型時,傳統的GPU集群(如使用NVIDIA的GPU)需要將模型分割並分佈到數百或數千個GPU上,這導致了極大的通訊cost和programming的複雜性。相比之下,Cerebras的單個WSE就能容納整個模型,大大簡化了訓練過程。在推理方面,WSE的大容量晶片上記憶體和超高記憶體頻寬使得即使是最大的AI模型也能保持在晶片上,極大地降低了延遲。

商業模式:靈活性與可擴展性

以行動支持創作者!付費即可解鎖
本篇內容共 5823 字、0 則留言,僅發佈於IEO 國際財經科技前沿觀察你目前無法檢視以下內容,可能因為尚未登入,或沒有該房間的查看權限。
每天閱讀大量資訊的 IEObserve 國際經濟觀察,為你介紹最新的國際財經、政治與科技趨勢潮流和商業分析,從資本市場國際股市切入,介紹與分析影響世界的巨無霸公司,以及哪些成長飛速的新創與高成長公司,正在悄悄改變世界。適合想獲取最新世界不同產業趨勢與經濟變化相關資訊的好學者。
留言0
查看全部
發表第一個留言支持創作者!
記憶體大廠 Micron 美光Q3財報營收年增93.3%至77.5億,優於預期的76.5億。毛利率續升至36.5%,Q3營業利潤17.4億,EPS 1.18優於預期的1.12。 DRAM營收季增14%至53億,ASP平均售價季增約15%。NAND營收季增15%至24億,ASP季增高個位數。 美光
AI的增速正在放緩?但ASIC和光通訊的成長能無虞?
我們常說從生活中選股,其實如果你是樂迷聽團仔,或是追星族,在你付錢買票進場看演唱會時,你其實也有相應的上市公司是可能可以投資的標的。
微軟 Q2財報市場看到了什麼問題?Azure 雲端成長放緩是泡沫要爆了?你可能想得太多
Tesla一直強調自己是AI公司,EV的銷量成長慘淡,能源業務爆發,馬斯克畫出的大餅該如何估值?
Netflix 繼續擠出超預期的新增用戶,但對未來成長展望相對保守?
記憶體大廠 Micron 美光Q3財報營收年增93.3%至77.5億,優於預期的76.5億。毛利率續升至36.5%,Q3營業利潤17.4億,EPS 1.18優於預期的1.12。 DRAM營收季增14%至53億,ASP平均售價季增約15%。NAND營收季增15%至24億,ASP季增高個位數。 美光
AI的增速正在放緩?但ASIC和光通訊的成長能無虞?
我們常說從生活中選股,其實如果你是樂迷聽團仔,或是追星族,在你付錢買票進場看演唱會時,你其實也有相應的上市公司是可能可以投資的標的。
微軟 Q2財報市場看到了什麼問題?Azure 雲端成長放緩是泡沫要爆了?你可能想得太多
Tesla一直強調自己是AI公司,EV的銷量成長慘淡,能源業務爆發,馬斯克畫出的大餅該如何估值?
Netflix 繼續擠出超預期的新增用戶,但對未來成長展望相對保守?
你可能也想看
Google News 追蹤
Thumbnail
本專欄將提供給您最新的市場資訊、產業研究、交易心法、精選公司介紹,以上內容並非個股分析,還請各位依據自身狀況作出交易決策。歡迎訂閱支持我,獲得相關內容,也祝您的投資之路順遂! 每年 $990 訂閱方案👉 https://reurl.cc/VNYVxZ 每月 $99 訂閱方案👉https://re
Thumbnail
你是否也在關注 NVIDIA 的股價走勢?近期這家 AI 晶片巨頭遭遇了一連串壞消息,股價應聲下跌。但別急著悲觀!有分析師認為,這反而可能是絕佳的買進時機。今天就讓我們一起來看看,為什麼在 NVIDIA 股價大跌之際,反而可能是明智投資者的最佳入場時機
Thumbnail
深入分析近期市場動態,包括颱風影響、AI展覽延遲、外資和投信行為、融資餘額風險等。報告提供了NVIDIA和Broadcom等公司的詳細分析,並對未來市場走勢和投資策略提出建議。通過對AI相關股票的估值風險和市場盤整期的預測,為投資者提供全面的市場觀察和投資指南。
Nvidia收123.54美元上揚4.76%,根據路透社22日獨家報導Nvidia正在開發新一代「Blackwell」AI晶片的中國版本,目前暫時定名為「B20」,將完全符合美國目前的出口管制規定,在利多消息刺激下Nvidia止跌上漲,帶動科技類股反攻,SOX大漲4%...
Thumbnail
先前有消息指出,為了將低對外購 AI 晶片的依賴,微軟投資支持的生成式 AI 應用大廠 OpenAI 已經開始自行設計與生產相關晶片的計畫,並且已經接觸了包括博通 (Broadcom) 等多家晶片大廠。
Thumbnail
COMPUTEX 之後 AI 議題持續發燒,其實背後就僅是一間公司把這波熱潮推至高峰:NVIDIA。NVIDIA 憑著 AI GPU 的大獲成功成為市值最高的公司,甚至超越了蘋果和 Google。
Thumbnail
人工智慧(AI)近年掀起話題,以輝達(Nvidia)為首的 AI 概念股漲勢驚人,而專家看好,雲端企業軟體巨頭 Salesforce 和叫車巨頭 Uber 是兩大尚未漲多的 AI 潛力股。
Thumbnail
近日OpenAI與蘋果合作,美國新創產業研究公司PitchBook數據,今年NVIDIA也持續押注,參與韓國新創Twelve Labs的A輪募資,投資約5,000萬美元(約新台幣16億元),大大幫助Twelve Labs開發AI。
25日Nvidia大漲6.76%收126.09美元,結束連續下跌的走勢,漲幅居SOX 30支成分股之冠,之前三個交易日Nvidia一口氣重挫12.89%,讓AI族群也全數哀嚎,隨著Nvidia的止跌轉漲,晶片類股台積電ADR也收漲2.86%,ARM也大漲6.31%......
Thumbnail
  寫這篇文章的時候,NVIDIA的股價還是上漲的,看起來“AI”這個題材還是持續奔跑,要跑到什麼時候我不知道。 不過,可以知道的是,現在只要沾的上邊,說的上故事,都可以有“AI”,下面這張圖是朋友傳給我的,我不得不承認都還“蠻有道理”的。 我想我們都可以幫忙找一些市場“忽略”的AI聯想股
Thumbnail
除現有已知的 AI 硬體建構廠商外,本篇並列出作者對於下一波 AI 應用興起時之潛力企業觀察清單,包含網路服務、網路安全、行業運用方案解決業者、與 AI 軟體開發商等。
Thumbnail
本專欄將提供給您最新的市場資訊、產業研究、交易心法、精選公司介紹,以上內容並非個股分析,還請各位依據自身狀況作出交易決策。歡迎訂閱支持我,獲得相關內容,也祝您的投資之路順遂! 每年 $990 訂閱方案👉 https://reurl.cc/VNYVxZ 每月 $99 訂閱方案👉https://re
Thumbnail
你是否也在關注 NVIDIA 的股價走勢?近期這家 AI 晶片巨頭遭遇了一連串壞消息,股價應聲下跌。但別急著悲觀!有分析師認為,這反而可能是絕佳的買進時機。今天就讓我們一起來看看,為什麼在 NVIDIA 股價大跌之際,反而可能是明智投資者的最佳入場時機
Thumbnail
深入分析近期市場動態,包括颱風影響、AI展覽延遲、外資和投信行為、融資餘額風險等。報告提供了NVIDIA和Broadcom等公司的詳細分析,並對未來市場走勢和投資策略提出建議。通過對AI相關股票的估值風險和市場盤整期的預測,為投資者提供全面的市場觀察和投資指南。
Nvidia收123.54美元上揚4.76%,根據路透社22日獨家報導Nvidia正在開發新一代「Blackwell」AI晶片的中國版本,目前暫時定名為「B20」,將完全符合美國目前的出口管制規定,在利多消息刺激下Nvidia止跌上漲,帶動科技類股反攻,SOX大漲4%...
Thumbnail
先前有消息指出,為了將低對外購 AI 晶片的依賴,微軟投資支持的生成式 AI 應用大廠 OpenAI 已經開始自行設計與生產相關晶片的計畫,並且已經接觸了包括博通 (Broadcom) 等多家晶片大廠。
Thumbnail
COMPUTEX 之後 AI 議題持續發燒,其實背後就僅是一間公司把這波熱潮推至高峰:NVIDIA。NVIDIA 憑著 AI GPU 的大獲成功成為市值最高的公司,甚至超越了蘋果和 Google。
Thumbnail
人工智慧(AI)近年掀起話題,以輝達(Nvidia)為首的 AI 概念股漲勢驚人,而專家看好,雲端企業軟體巨頭 Salesforce 和叫車巨頭 Uber 是兩大尚未漲多的 AI 潛力股。
Thumbnail
近日OpenAI與蘋果合作,美國新創產業研究公司PitchBook數據,今年NVIDIA也持續押注,參與韓國新創Twelve Labs的A輪募資,投資約5,000萬美元(約新台幣16億元),大大幫助Twelve Labs開發AI。
25日Nvidia大漲6.76%收126.09美元,結束連續下跌的走勢,漲幅居SOX 30支成分股之冠,之前三個交易日Nvidia一口氣重挫12.89%,讓AI族群也全數哀嚎,隨著Nvidia的止跌轉漲,晶片類股台積電ADR也收漲2.86%,ARM也大漲6.31%......
Thumbnail
  寫這篇文章的時候,NVIDIA的股價還是上漲的,看起來“AI”這個題材還是持續奔跑,要跑到什麼時候我不知道。 不過,可以知道的是,現在只要沾的上邊,說的上故事,都可以有“AI”,下面這張圖是朋友傳給我的,我不得不承認都還“蠻有道理”的。 我想我們都可以幫忙找一些市場“忽略”的AI聯想股
Thumbnail
除現有已知的 AI 硬體建構廠商外,本篇並列出作者對於下一波 AI 應用興起時之潛力企業觀察清單,包含網路服務、網路安全、行業運用方案解決業者、與 AI 軟體開發商等。