2024-09-23|閱讀時間 ‧ 約 4 分鐘

META為何開源Llama系列LLM

身為科技巨頭之一的META在生成式大型語言模型賽道中,看似落後OpenAI、Anthropic,實際上META仍然是AI賽道中的強大競爭者,首先META在2024Q2財報中顯示他們有能力將AI變現,透過把廣告更精準地投放給消費者,財報顯示Q2的營收有高達98%來自於廣告業務,營業利益率從29%成長至38%,成長高達9%,表示客戶願意花費更高的金額進行投放,這也間接說明META帶來的廣告效益獲得客戶的認同。META展示了自己的AI火力,讓投資者更加確信AI並不是空談、不是曇花一現的題材。


在輝達舉行2024年的電腦繪圖大會中,邀請META執行長祖克柏擔任嘉賓,與輝達執行長黃仁勳聊AI,祖克柏談到META目前全力發展生成式AI技術,並且未來會與META旗下的FB、IG進行整合,為用戶提供更佳的用戶體驗,META預計至2024年底將擁有近60萬個「H100」GPU,由此可見META的野心絕對不會甘於現狀,未來應該會持續投入研發與資料中心建設。


祖克柏在Q2財報電話會議上表示:「訓練Llama4需要的運算量可能是Llama3所需的計算量近10倍,而且未來模型還會持續增長,很難預測未來幾代的發展。」,並且還表示寧願在需要之前建設算力,而不是為時已晚,代表META會持續進行龐大的資料中心基礎建設的資本支出,為整個供應鏈注入一劑強心針,同時也會讓科技巨頭之間「算力」的軍備競賽更為激烈。


前面說了這麼多,只說了META投入非常多的資本、時間來研發AI,都沒說到為何META這麼佛心,要推出Llama系列模型?我有一些淺見,可能不見得是對的請各位見諒,只是提出小小的想法。


以下列出幾點我的想法:

  1. 開源可以促使生態系更加進步,舉例來說臺灣的Project TAME是以Llama-3作為基礎模型,或是Llama3 TAIDE 系列模型以 Meta 公司釋出的 LLaMA3–8b 為基礎,或許未來可以與不同領域的企業有深入的商業合作。
  2. META想創造生態系,不要忘記META還有一個重要發展項目「元宇宙」,META的企圖心不是只有AI、元宇宙,而是融合AI和元宇宙,個人認為「遊戲」、「影音」是META最可能先引入生成式AI到元宇宙的項目,因此對元宇宙而言,META開源生成式AI讓開源社群開發大量應用,有可能是在為此鋪路。
  3. META目前具有LLM開源的主導地位具有影響力,能夠在未來建立標準和工具成為LLM開源不可或缺的角色。
  4. Meta有開源8B和70B的模型,讓不少開發者都可以在這些模型上,進一步開發屬於自己的模型,能吸引到全球開發者參與,讓META可以接觸到不同領域的技術人才,挖掘LLM的應用場景。
  5. 最後一點是商譽,一間企業願意開源,是否代表著更加開放與透明,除此之外,AI發展迅速,政府勢必會有更加嚴格的監管和要求企業要透明化,因此META先做開源這步,我認為可以取得公眾的信任,同時也是釋出善意可能願意接受監管科技。
分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.