AI | 比NVIDIA晶片推論速度還快的新創Groq

更新 發佈閱讀 2 分鐘


raw-image


根據相關資料,Groq的Language Processing Unit (LPU) 在進行大型語言模型推論時,速度比NVIDIA的A100 GPU快得多。以下是幾個關鍵點:

1. Groq的LPU專門設計用於超高速AI推論,而不是像GPU那樣主要用於圖形處理[ ❶ ](https://www.linkedin.com/posts/raphaelmansuy_18x-faster-ai-inference-than-gpu-groq-lpu-activity-7165185102065442816-Rhcq)。


2. 在測試中,使用70B大型語言模型時,Groq的LPU的推論速度比GPU快18倍[ ❶ ](https://www.linkedin.com/posts/raphaelmansuy_18x-faster-ai-inference-than-gpu-groq-lpu-activity-7165185102065442816-Rhcq)。


3. Groq的LPU被描述為"讓GPU望塵莫及"的AI加速器[ ❷ ](https://medium.com/@cognidownunder/groqs-lpu-the-ai-accelerator-that-s-leaving-gpus-in-the-dust-bb6fff67a877)。


然而,值得注意的是,一些可信的人士表示,NVIDIA在推論方面可能比Groq更便宜,儘管Groq在具體數據方面一直保持謹慎[ ❸ ](https://www.reddit.com/r/singularity/comments/1c845st/the_speed_at_which_groq_chips_run_llama3_is/)。


總的來說,就純粹的推論速度而言,Groq的LPU似乎比NVIDIA的A100 GPU快得多,特別是在處理大型語言模型時。但在選擇使用哪種技術時,還需要考慮其他因素,如成本效益和整體性能。


我覺得還不錯用,而且免費就能用非常多次,我也很鼓勵付費,讓整個AI產業能繼續蓬勃發展



留言
avatar-img
留言分享你的想法!
avatar-img
分析師的市場觀點
308會員
1.5K內容數
很高興能夠成為你實踐財富自由的第一步,歡迎瀏覽進階訂閱方案 原價每天不到5元,CP值最高,超越報紙資訊的法人投行分析。 精簡快速分享投行法人研究及操盤思維 希望能讓你我用最少時間、精力、資金洞察近期金融市場的變化與重點分享。
2025/04/29
摘要 儘管投資者因宏觀經濟和供應鏈風險而情緒惡化,但GPU的核心需求因全球LLM(大型語言模型)推理晶片短缺而激增。Blackwell晶片供應受限,但需求強勁,尤其是GB200/300型號,且推理需求的爆發性增長(部分數據顯示代幣生成量年增5倍)推動了投資熱潮。摩根士丹利認為,這種需求來自實際應用
Thumbnail
2025/04/29
摘要 儘管投資者因宏觀經濟和供應鏈風險而情緒惡化,但GPU的核心需求因全球LLM(大型語言模型)推理晶片短缺而激增。Blackwell晶片供應受限,但需求強勁,尤其是GB200/300型號,且推理需求的爆發性增長(部分數據顯示代幣生成量年增5倍)推動了投資熱潮。摩根士丹利認為,這種需求來自實際應用
Thumbnail
2025/04/29
景碩(3189.TW):1Q25 初步財報摘要 - 會計政策調整,EPS 符合預期 1Q25 財報概覽景碩1Q25核心業務(營業利益)低於高盛預期10%,低於彭博共識26%,主因ABF新廠(K6廠)獲利能力低於預期(1Q25虧損)。公司1Q25毛利率較高盛/彭博共識低6.9/7.6個百分點,且
Thumbnail
2025/04/29
景碩(3189.TW):1Q25 初步財報摘要 - 會計政策調整,EPS 符合預期 1Q25 財報概覽景碩1Q25核心業務(營業利益)低於高盛預期10%,低於彭博共識26%,主因ABF新廠(K6廠)獲利能力低於預期(1Q25虧損)。公司1Q25毛利率較高盛/彭博共識低6.9/7.6個百分點,且
Thumbnail
2025/04/29
摘要 報告指出,南亞電路板(8046.TW)第一季營收達84.58億新台幣(季增7%),超出預期,主要受益於ABF載板(用於800G)和BT載板(用於記憶體)需求強勁,帶動毛利率提升至5.0%。第二季因關稅暫停刺激需求,營收預計季增10%,但下半年可能放緩。報告上調目標價至73新台幣,但維持「減持
Thumbnail
2025/04/29
摘要 報告指出,南亞電路板(8046.TW)第一季營收達84.58億新台幣(季增7%),超出預期,主要受益於ABF載板(用於800G)和BT載板(用於記憶體)需求強勁,帶動毛利率提升至5.0%。第二季因關稅暫停刺激需求,營收預計季增10%,但下半年可能放緩。報告上調目標價至73新台幣,但維持「減持
Thumbnail
看更多
你可能也想看
Thumbnail
十一月底正好要去斯里蘭卡,之前趁雙十一時就把旅行必備東西陸續買齊。 現在我依然在斯里蘭卡的旅行路上,邊當旅人邊推薦旅行好物給你們!(這篇記得收藏起來喔!)
Thumbnail
十一月底正好要去斯里蘭卡,之前趁雙十一時就把旅行必備東西陸續買齊。 現在我依然在斯里蘭卡的旅行路上,邊當旅人邊推薦旅行好物給你們!(這篇記得收藏起來喔!)
Thumbnail
AI PC 是將 AI 模型與傳統 PC 緊密結合的裝置,為本地 AI 運算能力,更能保護用戶的隱私和數據安全。 AI PC 具有 NPU、CPU 以及 GPU,並能夠具備高算力 AI 應用的需求,在 AI 運算性能、效率跟功耗方面,NPU 相較 CPU 與 GPU 具有大幅優勢。
Thumbnail
AI PC 是將 AI 模型與傳統 PC 緊密結合的裝置,為本地 AI 運算能力,更能保護用戶的隱私和數據安全。 AI PC 具有 NPU、CPU 以及 GPU,並能夠具備高算力 AI 應用的需求,在 AI 運算性能、效率跟功耗方面,NPU 相較 CPU 與 GPU 具有大幅優勢。
Thumbnail
未來的AI處理器發展趨勢將會持續專注於提升效能並降低能源消耗。 以下是一些可能的發展方向: 新一代NPU:例如,英特爾已經發表了新一代AI PC處理器Lunar Lake,該處理器的NPU算力是前一代的3倍多,且耗能較前一代低40%。 多模態生成式AI的興起:這種AI結合了文本、圖像、視頻等多
Thumbnail
未來的AI處理器發展趨勢將會持續專注於提升效能並降低能源消耗。 以下是一些可能的發展方向: 新一代NPU:例如,英特爾已經發表了新一代AI PC處理器Lunar Lake,該處理器的NPU算力是前一代的3倍多,且耗能較前一代低40%。 多模態生成式AI的興起:這種AI結合了文本、圖像、視頻等多
Thumbnail
神經處理單元(NPU)主要用於加速人工智慧(AI)和機器學習(ML)任務。 以下是一些主要的應用領域和使用者: AI和機器學習:NPU是人工智慧和機器學習領域的直接受益者。這些技術依賴數據而蓬勃發展,NPU擅長消化和解釋大量資料集,使機器能夠以前所未有的速度學習。 智慧型設備和物聯網:在智慧型
Thumbnail
神經處理單元(NPU)主要用於加速人工智慧(AI)和機器學習(ML)任務。 以下是一些主要的應用領域和使用者: AI和機器學習:NPU是人工智慧和機器學習領域的直接受益者。這些技術依賴數據而蓬勃發展,NPU擅長消化和解釋大量資料集,使機器能夠以前所未有的速度學習。 智慧型設備和物聯網:在智慧型
Thumbnail
NVIDIA、Intel、Tenstorrent和RISC-V在AI半導體領域的競爭和合作。Intel在AI領域推出了一系列產品,Tenstorrent和Rapidus合作開發新技術,而RISC-V開放源碼指令集架構也受到了廣泛關注。這些內容都展示了AI半導體市場的技術革新和競爭激烈的情況。
Thumbnail
NVIDIA、Intel、Tenstorrent和RISC-V在AI半導體領域的競爭和合作。Intel在AI領域推出了一系列產品,Tenstorrent和Rapidus合作開發新技術,而RISC-V開放源碼指令集架構也受到了廣泛關注。這些內容都展示了AI半導體市場的技術革新和競爭激烈的情況。
Thumbnail
這篇文章探討了NVIDIA在推論式AI半導體市場的挑戰,以及介紹了Intel在AI領域的強化舉措。文章中提到了新興企業可能有機會取代現有市場領導者,並討論了RISC-V技術在AI半導體市場的應用和其他相關動向。
Thumbnail
這篇文章探討了NVIDIA在推論式AI半導體市場的挑戰,以及介紹了Intel在AI領域的強化舉措。文章中提到了新興企業可能有機會取代現有市場領導者,並討論了RISC-V技術在AI半導體市場的應用和其他相關動向。
Thumbnail
這是我最近在『網路安全停看聽』Podcast企劃的一集,文末會提供podcast單集連結,想讓眼睛休息的格友們也可點選收聽喔! 今年NVIDIA輝達這家公司在世界掀起了旋風,不管你之前有沒有購買這家公司的股票,當執行長黃仁勳先生訪台,台灣各家媒體爭相報導下,你總應該注意到這家厲害的公司了。Go
Thumbnail
這是我最近在『網路安全停看聽』Podcast企劃的一集,文末會提供podcast單集連結,想讓眼睛休息的格友們也可點選收聽喔! 今年NVIDIA輝達這家公司在世界掀起了旋風,不管你之前有沒有購買這家公司的股票,當執行長黃仁勳先生訪台,台灣各家媒體爭相報導下,你總應該注意到這家厲害的公司了。Go
Thumbnail
GPU,既能支援大規模人工智慧計算,現在也能夠支援一些量子軟體,各家公司都在密切關注這個發展趨勢。 GPU已經改變了人工智慧的格局,現在也準備投身量子計算領域,儘管量子技術尚未成熟,但許多公司已經找到可以在與人工智慧相同的晶片上,運行複雜的量子演算法。近年來,由於GPU和其他先進晶片提供的計算
Thumbnail
GPU,既能支援大規模人工智慧計算,現在也能夠支援一些量子軟體,各家公司都在密切關注這個發展趨勢。 GPU已經改變了人工智慧的格局,現在也準備投身量子計算領域,儘管量子技術尚未成熟,但許多公司已經找到可以在與人工智慧相同的晶片上,運行複雜的量子演算法。近年來,由於GPU和其他先進晶片提供的計算
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News