Meta發布Llama 4,分數超越Deepseek Claude 3.7等競爭對手

更新於 發佈於 閱讀時間約 1 分鐘
投資理財內容聲明

摘要

Meta 推出了 Llama 4 系列模型,包括 Llama 4 Scout 和 Llama 4 Maverick,這兩款開源多模態模型採用混合專家(MoE)架構,並在效能和成本效益上超越前代及競爭對手。Llama 4 Scout 擁有 170 億活躍參數和 10M 上下文窗口,適合單一 GPU 部署;Llama 4 Maverick 則在推理和編碼任務上表現優異,媲美更大規模的模型。此外,Meta 預覽了仍在訓練中的 Llama 4 Behemoth,這是一款 2880 億參數的頂級模型,專注於 STEM 領域的表現。這些模型強調開放創新,並整合了安全措施與偏見緩解技術。

關鍵點

  • Llama 4 Scout:170 億活躍參數、16 位專家,支援 10M 上下文窗口,適合單一 H100 GPU 部署,在多模態任務中表現卓越。
  • Llama 4 Maverick:170 億活躍參數、128 位專家,在推理、編碼和圖像理解上超越 GPT-4o 和 Gemini 2.0,成本效益高。
  • Llama 4 Behemoth:2880 億參數的教師模型,專注於 STEM 基準測試,未來將支援更小模型的蒸餾訓練。
  • 混合專家架構(MoE):僅激活部分參數,提升訓練和推理效率,同時保持模型效能。
  • 多模態整合:早期融合技術統一處理文本和視覺數據,增強跨模態理解能力。
  • 安全措施:包含預訓練數據過濾、系統級防護工具(如 Llama Guard),以及自動化紅隊測試(GOAT)。
  • 偏見改進:Llama 4 在政治和社會議題上的回應偏見顯著降低,拒絕回答的比例從 7% 降至 2%。


raw-image
raw-image
raw-image
raw-image
raw-image



avatar-img
分析師的市場觀點
218會員
708內容數
很高興能夠成為你實踐財富自由的第一步,歡迎瀏覽進階訂閱方案 原價每天不到5元,CP值最高,超越報紙資訊的法人投行分析。 精簡快速分享投行法人研究及操盤思維 希望能讓你我用最少時間、精力、資金洞察近期金融市場的變化與重點分享。
留言
avatar-img
留言分享你的想法!
分析師的市場觀點 的其他內容
摘要 本報告探討2025年第二季亞太地區的全球信貸狀況,重點包括美國進口關稅對經濟成長的負面影響、中國政策刺激方案的抵銷作用,以及亞太地區政策利率可能調降的趨勢。報告指出,儘管外部壓力存在,亞太地區的國內需求動能仍將保持穩健,經濟成長不會陷入停滯。 關鍵點 美國進口關稅將降低美國及其他地區的G
最新動態 繼4月4日的關稅影響報告後,我們提供對蘋果、PC及潛在需求影響的最新觀點。 評論 我們對「9903.01.34」關於美國內容的解讀:我們認為部分人對昨天發布的關稅豁免條款有所誤解,該條款指出「關稅不適用於美國內容的產品,前提是至少20%的海關價值源自美國」。一方面,非美國
摘要 摩根士丹利亞洲團隊分析指出,美國對中國加徵的關稅將對中國經濟成長造成顯著拖累,預計2025年GDP增長可能低於基準預測的4.5%。此次關稅衝擊比2018-19年更嚴重,涉及範圍更廣,且伴隨供應鏈重組的緩衝效果減弱。北京可能加速刺激政策,但仍難以完全抵消關稅影響,同時通縮壓力與房地產等結構性問
摘要 美國政府計劃對產品中非美國價值的部分課徵對等關稅,市場對此的解讀存在誤區,即使美國價值超過20%,非美國部分仍需課稅。半導體產業未來可能面臨32%的關稅,影響將因屬人或屬地主義而異,美國IC業者如nVidia、AMD等可能出貨量下降,而Apple因中國製造比重高,成本可能大幅上升,iPhon
摘要 美國總統特朗普於2025年4月2日簽署行政命令,對180多個國家加徵10%~50%的關稅,預計將導致需求減弱或利潤壓力。高盛分析指出,消費性電子產品(如PC和低價智能手機)受影響較大,而企業級產品(如伺服器)影響較小。報告下調了30家科技公司的盈利預測和目標價,並按產品類別和地區產能分佈評估
金融市場資訊整理 (2025/4/4) 1. 重點摘要 美股重挫: 主要指數全線下跌,道瓊跌 5.50%,標普跌 5.97%,納指跌 5.82%,費半跌 7.60%。 市場擔憂中美貿易戰升級,中國宣布將對美國實施 34% 報復性關稅,並限制稀土出口。 聯準會主席鮑威爾表示 不急於降息,市
摘要 本報告探討2025年第二季亞太地區的全球信貸狀況,重點包括美國進口關稅對經濟成長的負面影響、中國政策刺激方案的抵銷作用,以及亞太地區政策利率可能調降的趨勢。報告指出,儘管外部壓力存在,亞太地區的國內需求動能仍將保持穩健,經濟成長不會陷入停滯。 關鍵點 美國進口關稅將降低美國及其他地區的G
最新動態 繼4月4日的關稅影響報告後,我們提供對蘋果、PC及潛在需求影響的最新觀點。 評論 我們對「9903.01.34」關於美國內容的解讀:我們認為部分人對昨天發布的關稅豁免條款有所誤解,該條款指出「關稅不適用於美國內容的產品,前提是至少20%的海關價值源自美國」。一方面,非美國
摘要 摩根士丹利亞洲團隊分析指出,美國對中國加徵的關稅將對中國經濟成長造成顯著拖累,預計2025年GDP增長可能低於基準預測的4.5%。此次關稅衝擊比2018-19年更嚴重,涉及範圍更廣,且伴隨供應鏈重組的緩衝效果減弱。北京可能加速刺激政策,但仍難以完全抵消關稅影響,同時通縮壓力與房地產等結構性問
摘要 美國政府計劃對產品中非美國價值的部分課徵對等關稅,市場對此的解讀存在誤區,即使美國價值超過20%,非美國部分仍需課稅。半導體產業未來可能面臨32%的關稅,影響將因屬人或屬地主義而異,美國IC業者如nVidia、AMD等可能出貨量下降,而Apple因中國製造比重高,成本可能大幅上升,iPhon
摘要 美國總統特朗普於2025年4月2日簽署行政命令,對180多個國家加徵10%~50%的關稅,預計將導致需求減弱或利潤壓力。高盛分析指出,消費性電子產品(如PC和低價智能手機)受影響較大,而企業級產品(如伺服器)影響較小。報告下調了30家科技公司的盈利預測和目標價,並按產品類別和地區產能分佈評估
金融市場資訊整理 (2025/4/4) 1. 重點摘要 美股重挫: 主要指數全線下跌,道瓊跌 5.50%,標普跌 5.97%,納指跌 5.82%,費半跌 7.60%。 市場擔憂中美貿易戰升級,中國宣布將對美國實施 34% 報復性關稅,並限制稀土出口。 聯準會主席鮑威爾表示 不急於降息,市
你可能也想看
Google News 追蹤
Thumbnail
【vocus 精選投資理財/金融類沙龍,輸入 "moneyback" 年訂閱 9 折】 市場動盪時,加碼永遠值得的投資標的——「自己」 川普政府再度拋出關稅震撼彈,全球市場應聲重挫,從散戶到專業投資人,都急著找尋買進殺出的訊號,就是現在,輪到知識進場!把握時機讓自己升級,別放過反彈的機會!
Thumbnail
在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 新模型和 Human Baselines 排名將不斷變化,Human Baselines 的位置自從基礎模型出現以來,它就不再具有多大意義了,這些排名只是表明經典 NL
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 繼 AI說書 - 從0開始 - 82 與 xxx ,我們談論了衡量 AI 模型的方式,那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時,需要
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 77 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 76 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 75 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
在AI時代中,GPT技術正在改變我們的生活。然而,SLM(小型語言模型)也開始受到關注,具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。
Thumbnail
未來不管是Diffuser還是LLM的微調,都離不開LoRA這項技術,充分理解LoRA的本質是甚麼,CP值特別高。這項技術的理念其實在人工智慧領域行之有年,只是普遍沒有響亮的名字與非常痛的應用場合,在大模型參數量暴增的時刻,重要性被大幅凸顯出來。
Thumbnail
【vocus 精選投資理財/金融類沙龍,輸入 "moneyback" 年訂閱 9 折】 市場動盪時,加碼永遠值得的投資標的——「自己」 川普政府再度拋出關稅震撼彈,全球市場應聲重挫,從散戶到專業投資人,都急著找尋買進殺出的訊號,就是現在,輪到知識進場!把握時機讓自己升級,別放過反彈的機會!
Thumbnail
在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 新模型和 Human Baselines 排名將不斷變化,Human Baselines 的位置自從基礎模型出現以來,它就不再具有多大意義了,這些排名只是表明經典 NL
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 繼 AI說書 - 從0開始 - 82 與 xxx ,我們談論了衡量 AI 模型的方式,那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時,需要
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 77 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 76 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 75 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
在AI時代中,GPT技術正在改變我們的生活。然而,SLM(小型語言模型)也開始受到關注,具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。
Thumbnail
未來不管是Diffuser還是LLM的微調,都離不開LoRA這項技術,充分理解LoRA的本質是甚麼,CP值特別高。這項技術的理念其實在人工智慧領域行之有年,只是普遍沒有響亮的名字與非常痛的應用場合,在大模型參數量暴增的時刻,重要性被大幅凸顯出來。