Meta發布Llama 4，分數超越Deepseek Claude 3.7等競爭對手

更新於 2025/04/07發佈於 2025/04/07閱讀時間約 1 分鐘

投資理財內容聲明

摘要

Meta 推出了 Llama 4 系列模型，包括 Llama 4 Scout 和 Llama 4 Maverick，這兩款開源多模態模型採用混合專家（MoE）架構，並在效能和成本效益上超越前代及競爭對手。Llama 4 Scout 擁有 170 億活躍參數和 10M 上下文窗口，適合單一 GPU 部署；Llama 4 Maverick 則在推理和編碼任務上表現優異，媲美更大規模的模型。此外，Meta 預覽了仍在訓練中的 Llama 4 Behemoth，這是一款 2880 億參數的頂級模型，專注於 STEM 領域的表現。這些模型強調開放創新，並整合了安全措施與偏見緩解技術。

關鍵點

Llama 4 Scout：170 億活躍參數、16 位專家，支援 10M 上下文窗口，適合單一 H100 GPU 部署，在多模態任務中表現卓越。
Llama 4 Maverick：170 億活躍參數、128 位專家，在推理、編碼和圖像理解上超越 GPT-4o 和 Gemini 2.0，成本效益高。
Llama 4 Behemoth：2880 億參數的教師模型，專注於 STEM 基準測試，未來將支援更小模型的蒸餾訓練。
混合專家架構（MoE）：僅激活部分參數，提升訓練和推理效率，同時保持模型效能。
多模態整合：早期融合技術統一處理文本和視覺數據，增強跨模態理解能力。
安全措施：包含預訓練數據過濾、系統級防護工具（如 Llama Guard），以及自動化紅隊測試（GOAT）。
偏見改進：Llama 4 在政治和社會議題上的回應偏見顯著降低，拒絕回答的比例從 7% 降至 2%。

分析師的市場觀點

218會員

708內容數

很高興能夠成為你實踐財富自由的第一步，歡迎瀏覽進階訂閱方案原價每天不到5元，CP值最高，超越報紙資訊的法人投行分析。精簡快速分享投行法人研究及操盤思維希望能讓你我用最少時間、精力、資金洞察近期金融市場的變化與重點分享。

留言

留言分享你的想法！

分析師的市場觀點的其他內容

外資標普全球S&P Global 2025第二季全球信貸狀況，亞太地區會議

摘要本報告探討2025年第二季亞太地區的全球信貸狀況，重點包括美國進口關稅對經濟成長的負面影響、中國政策刺激方案的抵銷作用，以及亞太地區政策利率可能調降的趨勢。報告指出，儘管外部壓力存在，亞太地區的國內需求動能仍將保持穩健，經濟成長不會陷入停滯。關鍵點美國進口關稅將降低美國及其他地區的G

#投資 #台股 #外資報告

外資廣發證券GFHK看川普關稅，對消費電子衝擊評估

最新動態繼4月4日的關稅影響報告後，我們提供對蘋果、PC及潛在需求影響的最新觀點。評論我們對「9903.01.34」關於美國內容的解讀：我們認為部分人對昨天發布的關稅豁免條款有所誤解，該條款指出「關稅不適用於美國內容的產品，前提是至少20%的海關價值源自美國」。一方面，非美國

#投資 #台股 #外資報告

外資大摩MS看川普關稅，對中國經濟成長造成顯著拖累

摘要摩根士丹利亞洲團隊分析指出，美國對中國加徵的關稅將對中國經濟成長造成顯著拖累，預計2025年GDP增長可能低於基準預測的4.5%。此次關稅衝擊比2018-19年更嚴重，涉及範圍更廣，且伴隨供應鏈重組的緩衝效果減弱。北京可能加速刺激政策，但仍難以完全抵消關稅影響，同時通縮壓力與房地產等結構性問

#投資 #台股 #外資報告

美國川普關稅及各大內資投顧觀點整理

摘要美國政府計劃對產品中非美國價值的部分課徵對等關稅，市場對此的解讀存在誤區，即使美國價值超過20%，非美國部分仍需課稅。半導體產業未來可能面臨32%的關稅，影響將因屬人或屬地主義而異，美國IC業者如nVidia、AMD等可能出貨量下降，而Apple因中國製造比重高，成本可能大幅上升，iPhon

#投資 #台股 #股市

外資高盛GS看川普關稅，全面大幅下調30檔科技股票目標價

摘要美國總統特朗普於2025年4月2日簽署行政命令，對180多個國家加徵10%~50%的關稅，預計將導致需求減弱或利潤壓力。高盛分析指出，消費性電子產品（如PC和低價智能手機）受影響較大，而企業級產品（如伺服器）影響較小。報告下調了30家科技公司的盈利預測和目標價，並按產品類別和地區產能分佈評估

#投資 #台股 #外資報告

2025.04.07台股盤前及外電整理

金融市場資訊整理 (2025/4/4) 1. 重點摘要美股重挫：主要指數全線下跌，道瓊跌 5.50%，標普跌 5.97%，納指跌 5.82%，費半跌 7.60%。市場擔憂中美貿易戰升級，中國宣布將對美國實施 34% 報復性關稅，並限制稀土出口。聯準會主席鮑威爾表示不急於降息，市

#投資 #台股 #外資報告

外資標普全球S&P Global 2025第二季全球信貸狀況，亞太地區會議

#投資 #台股 #外資報告

外資廣發證券GFHK看川普關稅，對消費電子衝擊評估

#投資 #台股 #外資報告

外資大摩MS看川普關稅，對中國經濟成長造成顯著拖累

#投資 #台股 #外資報告

美國川普關稅及各大內資投顧觀點整理

#投資 #台股 #股市

外資高盛GS看川普關稅，全面大幅下調30檔科技股票目標價

你可能也想看

限時 9 折！精選投資理財沙龍推薦｜大盤動盪，知識進場

【vocus 精選投資理財/金融類沙龍，輸入 "moneyback" 年訂閱 9 折】市場動盪時，加碼永遠值得的投資標的——「自己」川普政府再度拋出關稅震撼彈，全球市場應聲重挫，從散戶到專業投資人，都急著找尋買進殺出的訊號，就是現在，輪到知識進場！把握時機讓自己升級，別放過反彈的機會！

#折扣碼 #方案 #投資

悠緣船帆的沙龍

2024/07/25

元宇宙巨頭的AI野心：Meta 推出Llama 3.1 模型，挑戰 AI 霸主地位

在AI領域的競爭中，Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1，這不僅是免費的，而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪，但它真的能與OpenAI和Google等巨頭抗衡嗎？讓我們一起深入探討

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。新模型和 Human Baselines 排名將不斷變化，Human Baselines 的位置自從基礎模型出現以來，它就不再具有多大意義了，這些排名只是表明經典 NL

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/07/12

AI說書 - 從0開始 - 84

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。繼 AI說書 - 從0開始 - 82 與 xxx ，我們談論了衡量 AI 模型的方式，那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時，需要

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/07/07

AI說書 - 從0開始 - 78

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 77 ，我們在給定句子「 Transformers possess surprising emerging features 」的情

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/07/07

AI說書 - 從0開始 - 77

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 76 ，我們在給定句子「 Transformers possess surprising emerging features 」的情

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/07/07

AI說書 - 從0開始 - 76

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 75 ，我們在給定句子「 Transformers possess surprising emerging features 」的情

#AI #ai #PromptEngineering

朵小芸的草味沙龍

2024/06/06

SLM是什麼？探索小型語言模型的未來趨勢

在AI時代中，GPT技術正在改變我們的生活。然而，SLM（小型語言模型）也開始受到關注，具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。

#SLM #LLM #大語言模型

Frank Plaza

2024/02/28

ComfyUI 研究 - LCM & SDXL Turbo

這篇介紹LCM跟SDXL Turbo。

#comfyui #stablediffusion #AI繪圖

私大教育所 (私人大學教育研究所) by mr gary

三分鐘內由上帝視角理解LoRA，讓大模型成為達文西的秘訣

未來不管是Diffuser還是LLM的微調，都離不開LoRA這項技術，充分理解LoRA的本質是甚麼，CP值特別高。這項技術的理念其實在人工智慧領域行之有年，只是普遍沒有響亮的名字與非常痛的應用場合，在大模型參數量暴增的時刻，重要性被大幅凸顯出來。

#LoRA #LowRank #finetune

方格子 vocus 官方沙龍

2025/04/10

限時 9 折！精選投資理財沙龍推薦｜大盤動盪，知識進場

#折扣碼 #方案 #投資

悠緣船帆的沙龍

2024/07/25

元宇宙巨頭的AI野心：Meta 推出Llama 3.1 模型，挑戰 AI 霸主地位

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/07/12

AI說書 - 從0開始 - 84

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/07/07

AI說書 - 從0開始 - 78

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/07/07

AI說書 - 從0開始 - 77

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/07/07

AI說書 - 從0開始 - 76

#AI #ai #PromptEngineering

ComfyUI 研究 - LCM & SDXL Turbo

這篇介紹LCM跟SDXL Turbo。

#comfyui #stablediffusion #AI繪圖

私大教育所 (私人大學教育研究所) by mr gary

三分鐘內由上帝視角理解LoRA，讓大模型成為達文西的秘訣

#LoRA #LowRank #finetune