Meta發布Llama 4,分數超越Deepseek Claude 3.7等競爭對手

更新 發佈閱讀 1 分鐘
投資理財內容聲明

摘要

Meta 推出了 Llama 4 系列模型,包括 Llama 4 Scout 和 Llama 4 Maverick,這兩款開源多模態模型採用混合專家(MoE)架構,並在效能和成本效益上超越前代及競爭對手。Llama 4 Scout 擁有 170 億活躍參數和 10M 上下文窗口,適合單一 GPU 部署;Llama 4 Maverick 則在推理和編碼任務上表現優異,媲美更大規模的模型。此外,Meta 預覽了仍在訓練中的 Llama 4 Behemoth,這是一款 2880 億參數的頂級模型,專注於 STEM 領域的表現。這些模型強調開放創新,並整合了安全措施與偏見緩解技術。

關鍵點

  • Llama 4 Scout:170 億活躍參數、16 位專家,支援 10M 上下文窗口,適合單一 H100 GPU 部署,在多模態任務中表現卓越。
  • Llama 4 Maverick:170 億活躍參數、128 位專家,在推理、編碼和圖像理解上超越 GPT-4o 和 Gemini 2.0,成本效益高。
  • Llama 4 Behemoth:2880 億參數的教師模型,專注於 STEM 基準測試,未來將支援更小模型的蒸餾訓練。
  • 混合專家架構(MoE):僅激活部分參數,提升訓練和推理效率,同時保持模型效能。
  • 多模態整合:早期融合技術統一處理文本和視覺數據,增強跨模態理解能力。
  • 安全措施:包含預訓練數據過濾、系統級防護工具(如 Llama Guard),以及自動化紅隊測試(GOAT)。
  • 偏見改進:Llama 4 在政治和社會議題上的回應偏見顯著降低,拒絕回答的比例從 7% 降至 2%。


raw-image
raw-image
raw-image
raw-image
raw-image



留言
avatar-img
分析師的市場觀點
334會員
1.7K內容數
現職全台最大銀行擔任AI/科技股供應鏈投資分析師。 很高興能夠成為你實踐財富自由的第一步,歡迎瀏覽進階訂閱方案 原價每天不到5元,CP值最高,超越報紙資訊的法人投行分析。 精簡快速分享投行法人研究及操盤思維 希望能讓你我用最少時間、精力、資金洞察近期金融市場的變化與重點分享。
2025/04/30
摘要 該報告分析了Airtac(1590.TW)的財務表現與未來預測,重點包括2024年至2027年的營收與利潤增長、現金流與資本支出管理,以及環境、社會和治理(ESG)指標。報告指出,公司營收與EBITDA預計將持續增長,且自由現金流穩健,同時ESG指標顯示其在碳排放與治理結構上的進展。目標股價
Thumbnail
2025/04/30
摘要 該報告分析了Airtac(1590.TW)的財務表現與未來預測,重點包括2024年至2027年的營收與利潤增長、現金流與資本支出管理,以及環境、社會和治理(ESG)指標。報告指出,公司營收與EBITDA預計將持續增長,且自由現金流穩健,同時ESG指標顯示其在碳排放與治理結構上的進展。目標股價
Thumbnail
2025/04/30
摘要 台積電(TSMC)在2025年4月23日舉行的北美技術研討會中,分享了A14製程、先進封裝技術擴展路線圖及特殊製程等關鍵技術更新。儘管宏觀經濟不確定性存在,台積電憑藉半導體內容驅動的成長,尤其在AI與高效能運算(HPC)領域的強勁需求,使其在產業低迷期仍可能表現優異。報告重申對台積電的「買入
Thumbnail
2025/04/30
摘要 台積電(TSMC)在2025年4月23日舉行的北美技術研討會中,分享了A14製程、先進封裝技術擴展路線圖及特殊製程等關鍵技術更新。儘管宏觀經濟不確定性存在,台積電憑藉半導體內容驅動的成長,尤其在AI與高效能運算(HPC)領域的強勁需求,使其在產業低迷期仍可能表現優異。報告重申對台積電的「買入
Thumbnail
2025/04/30
摘要 摩根大通對台灣半導體設備製造商Kinik(1560.TW)持樂觀態度,認為其2025年第一季毛利率將優於預期,且長期展望穩健。報告指出,Kinik近期股價表現不佳已反映負面因素,如N2製程放緩與宏觀不確定性,但潛在催化劑包括第一季財報優於預期(受益於SBU利潤回升)及未來DBU客戶拓展。此外
Thumbnail
2025/04/30
摘要 摩根大通對台灣半導體設備製造商Kinik(1560.TW)持樂觀態度,認為其2025年第一季毛利率將優於預期,且長期展望穩健。報告指出,Kinik近期股價表現不佳已反映負面因素,如N2製程放緩與宏觀不確定性,但潛在催化劑包括第一季財報優於預期(受益於SBU利潤回升)及未來DBU客戶拓展。此外
Thumbnail
看更多
你可能也想看
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討
Thumbnail
在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 新模型和 Human Baselines 排名將不斷變化,Human Baselines 的位置自從基礎模型出現以來,它就不再具有多大意義了,這些排名只是表明經典 NL
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 新模型和 Human Baselines 排名將不斷變化,Human Baselines 的位置自從基礎模型出現以來,它就不再具有多大意義了,這些排名只是表明經典 NL
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 繼 AI說書 - 從0開始 - 82 與 xxx ,我們談論了衡量 AI 模型的方式,那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時,需要
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 繼 AI說書 - 從0開始 - 82 與 xxx ,我們談論了衡量 AI 模型的方式,那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時,需要
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 77 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 77 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 76 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 76 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 75 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 75 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
在AI時代中,GPT技術正在改變我們的生活。然而,SLM(小型語言模型)也開始受到關注,具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。
Thumbnail
在AI時代中,GPT技術正在改變我們的生活。然而,SLM(小型語言模型)也開始受到關注,具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。
Thumbnail
未來不管是Diffuser還是LLM的微調,都離不開LoRA這項技術,充分理解LoRA的本質是甚麼,CP值特別高。這項技術的理念其實在人工智慧領域行之有年,只是普遍沒有響亮的名字與非常痛的應用場合,在大模型參數量暴增的時刻,重要性被大幅凸顯出來。
Thumbnail
未來不管是Diffuser還是LLM的微調,都離不開LoRA這項技術,充分理解LoRA的本質是甚麼,CP值特別高。這項技術的理念其實在人工智慧領域行之有年,只是普遍沒有響亮的名字與非常痛的應用場合,在大模型參數量暴增的時刻,重要性被大幅凸顯出來。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News