Meta發布Llama 4,分數超越Deepseek Claude 3.7等競爭對手

更新 發佈閱讀 1 分鐘
投資理財內容聲明

摘要

Meta 推出了 Llama 4 系列模型,包括 Llama 4 Scout 和 Llama 4 Maverick,這兩款開源多模態模型採用混合專家(MoE)架構,並在效能和成本效益上超越前代及競爭對手。Llama 4 Scout 擁有 170 億活躍參數和 10M 上下文窗口,適合單一 GPU 部署;Llama 4 Maverick 則在推理和編碼任務上表現優異,媲美更大規模的模型。此外,Meta 預覽了仍在訓練中的 Llama 4 Behemoth,這是一款 2880 億參數的頂級模型,專注於 STEM 領域的表現。這些模型強調開放創新,並整合了安全措施與偏見緩解技術。

關鍵點

  • Llama 4 Scout:170 億活躍參數、16 位專家,支援 10M 上下文窗口,適合單一 H100 GPU 部署,在多模態任務中表現卓越。
  • Llama 4 Maverick:170 億活躍參數、128 位專家,在推理、編碼和圖像理解上超越 GPT-4o 和 Gemini 2.0,成本效益高。
  • Llama 4 Behemoth:2880 億參數的教師模型,專注於 STEM 基準測試,未來將支援更小模型的蒸餾訓練。
  • 混合專家架構(MoE):僅激活部分參數,提升訓練和推理效率,同時保持模型效能。
  • 多模態整合:早期融合技術統一處理文本和視覺數據,增強跨模態理解能力。
  • 安全措施:包含預訓練數據過濾、系統級防護工具(如 Llama Guard),以及自動化紅隊測試(GOAT)。
  • 偏見改進:Llama 4 在政治和社會議題上的回應偏見顯著降低,拒絕回答的比例從 7% 降至 2%。


raw-image
raw-image
raw-image
raw-image
raw-image



留言
avatar-img
分析師的市場觀點
377會員
1.8K內容數
現職全台最大銀行擔任AI/科技股供應鏈投資分析師。 很高興能夠成為你實踐財富自由的第一步,歡迎瀏覽進階訂閱方案 原價每天不到5元,CP值最高,超越報紙資訊的法人投行分析。 精簡快速分享投行法人研究及操盤思維 希望能讓你我用最少時間、精力、資金洞察近期金融市場的變化與重點分享。
2025/04/30
摘要 該報告分析了Airtac(1590.TW)的財務表現與未來預測,重點包括2024年至2027年的營收與利潤增長、現金流與資本支出管理,以及環境、社會和治理(ESG)指標。報告指出,公司營收與EBITDA預計將持續增長,且自由現金流穩健,同時ESG指標顯示其在碳排放與治理結構上的進展。目標股價
Thumbnail
2025/04/30
摘要 該報告分析了Airtac(1590.TW)的財務表現與未來預測,重點包括2024年至2027年的營收與利潤增長、現金流與資本支出管理,以及環境、社會和治理(ESG)指標。報告指出,公司營收與EBITDA預計將持續增長,且自由現金流穩健,同時ESG指標顯示其在碳排放與治理結構上的進展。目標股價
Thumbnail
2025/04/30
摘要 台積電(TSMC)在2025年4月23日舉行的北美技術研討會中,分享了A14製程、先進封裝技術擴展路線圖及特殊製程等關鍵技術更新。儘管宏觀經濟不確定性存在,台積電憑藉半導體內容驅動的成長,尤其在AI與高效能運算(HPC)領域的強勁需求,使其在產業低迷期仍可能表現優異。報告重申對台積電的「買入
Thumbnail
2025/04/30
摘要 台積電(TSMC)在2025年4月23日舉行的北美技術研討會中,分享了A14製程、先進封裝技術擴展路線圖及特殊製程等關鍵技術更新。儘管宏觀經濟不確定性存在,台積電憑藉半導體內容驅動的成長,尤其在AI與高效能運算(HPC)領域的強勁需求,使其在產業低迷期仍可能表現優異。報告重申對台積電的「買入
Thumbnail
2025/04/30
摘要 摩根大通對台灣半導體設備製造商Kinik(1560.TW)持樂觀態度,認為其2025年第一季毛利率將優於預期,且長期展望穩健。報告指出,Kinik近期股價表現不佳已反映負面因素,如N2製程放緩與宏觀不確定性,但潛在催化劑包括第一季財報優於預期(受益於SBU利潤回升)及未來DBU客戶拓展。此外
Thumbnail
2025/04/30
摘要 摩根大通對台灣半導體設備製造商Kinik(1560.TW)持樂觀態度,認為其2025年第一季毛利率將優於預期,且長期展望穩健。報告指出,Kinik近期股價表現不佳已反映負面因素,如N2製程放緩與宏觀不確定性,但潛在催化劑包括第一季財報優於預期(受益於SBU利潤回升)及未來DBU客戶拓展。此外
Thumbnail
看更多
你可能也想看
Thumbnail
創作不只是個人戰,在 vocus ,也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」,現在有了更強大的新夥伴加入!除了大家熟悉的「官方主題沙龍」,這次我們徵召了 8 位領域各異的「個人主題專家」,將再度嘗試創作的各種可能,和格友們激發出更多未知的火花。
Thumbnail
創作不只是個人戰,在 vocus ,也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」,現在有了更強大的新夥伴加入!除了大家熟悉的「官方主題沙龍」,這次我們徵召了 8 位領域各異的「個人主題專家」,將再度嘗試創作的各種可能,和格友們激發出更多未知的火花。
Thumbnail
vocus 最具指標性的創作者社群──「野格團」, 2026 年春季,這支充滿專業、熱情的團隊再次擴編,迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇,他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。
Thumbnail
vocus 最具指標性的創作者社群──「野格團」, 2026 年春季,這支充滿專業、熱情的團隊再次擴編,迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇,他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。
Thumbnail
在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討
Thumbnail
在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 新模型和 Human Baselines 排名將不斷變化,Human Baselines 的位置自從基礎模型出現以來,它就不再具有多大意義了,這些排名只是表明經典 NL
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 新模型和 Human Baselines 排名將不斷變化,Human Baselines 的位置自從基礎模型出現以來,它就不再具有多大意義了,這些排名只是表明經典 NL
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 繼 AI說書 - 從0開始 - 82 與 xxx ,我們談論了衡量 AI 模型的方式,那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時,需要
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 繼 AI說書 - 從0開始 - 82 與 xxx ,我們談論了衡量 AI 模型的方式,那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時,需要
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 77 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 77 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 76 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 76 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 75 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 75 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
在AI時代中,GPT技術正在改變我們的生活。然而,SLM(小型語言模型)也開始受到關注,具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。
Thumbnail
在AI時代中,GPT技術正在改變我們的生活。然而,SLM(小型語言模型)也開始受到關注,具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。
Thumbnail
未來不管是Diffuser還是LLM的微調,都離不開LoRA這項技術,充分理解LoRA的本質是甚麼,CP值特別高。這項技術的理念其實在人工智慧領域行之有年,只是普遍沒有響亮的名字與非常痛的應用場合,在大模型參數量暴增的時刻,重要性被大幅凸顯出來。
Thumbnail
未來不管是Diffuser還是LLM的微調,都離不開LoRA這項技術,充分理解LoRA的本質是甚麼,CP值特別高。這項技術的理念其實在人工智慧領域行之有年,只是普遍沒有響亮的名字與非常痛的應用場合,在大模型參數量暴增的時刻,重要性被大幅凸顯出來。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News