元宇宙巨頭的AI野心:Meta 推出Llama 3.1 模型,挑戰 AI 霸主地位

更新 發佈閱讀 2 分鐘

在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討這個新模型的特點和潛力。

raw-image


Llama 3.1:Meta的AI王牌

模型規模與訓練成本

Llama 3.1的訓練過程可謂是驚人的:

  • 使用了16,000個Nvidia H100 GPU
  • 訓練成本可能高達數億美元
  • 耗電量足以供應一個小國家

這種規模的投入凸顯了Meta在AI領域的野心和決心。

技術規格

  • 參數量:4050億
  • 上下文長度:128,000 tokens
  • 版本:8B、70B、405B(B代表十億參數)

根據基準測試,Llama 3.1在某些關鍵指標上甚至超越了OpenAI的GPT-4和Anthropic的Claude 3.5 Sonnet。

開源還是半開源?

Meta宣稱Llama 3.1是開源的,但事實上存在一些限制:

你可以用它賺錢,只要你的應用每月活躍用戶不超過7億。否則,你需要向Meta申請許可。

這種"有條件開源"的策略既推動了創新,又保護了Meta的商業利益。

訓練數據的神秘面紗

雖然模型權重是公開的,但訓練數據仍然是個謎。可能包括:

  • 你的部落格
  • GitHub倉庫
  • 2006年的Facebook帖子
  • 甚至可能包括WhatsApp消息

這引發了對數據隱私和道德使用的擔憂。

實際表現如何?

儘管基準測試結果令人印象深刻,但實際使用體驗可能會有所不同:

  1. 編碼能力:相當不錯,但仍落後於 Claude。
  2. 創意寫作:表現良好,但非最佳。
  3. 對新概念的理解:在處理未發布的新功能時表現欠佳。

AI發展的現狀反思

在過去的一年裡,我們看到了多家公司推出大型模型,但它們似乎都達到了相似的能力水平:

  • OpenAI從GPT-3到GPT-4實現了巨大飛躍
  • 之後的進展多為小幅增長
  • 預言中的"天網"級人工智能仍未出現

Meta的獨特定位

在AI炒作逐漸降溫的背景下,Meta的做法顯得格外理智:

  • 提供相對開放的模型
  • 保持技術透明度
  • 推動AI民主化

雖然可能隱藏著某些商業動機,但Llama項目無疑為Zuckerberg贏得了一些讚譽。

結論

Llama 3.1的發布標誌著AI領域競爭的新階段。儘管它可能不是革命性的突破,但它代表了大型科技公司在AI開發方面的持續投入和進步。


#人工智能 #Llama3.1 #Meta #開源AI #AI發展


留言
avatar-img
悠緣船帆的沙龍
109會員
190內容數
職場生存與成長必備技巧,快速掌握職場生存之道;面對職場逆境與挫折,在困境中掌控自己、重新出發
悠緣船帆的沙龍的其他內容
2024/10/11
想像一個沒有司機的世界,機器人能做任何事情,城市充滿綠地而不是停車場。這聽起來像科幻小說嗎?根據 Elon Musk 的說法,這個未來比我們想像的要近得多。 Tesla 的自動駕駛革命 Cybercab:無人駕駛的未來
Thumbnail
2024/10/11
想像一個沒有司機的世界,機器人能做任何事情,城市充滿綠地而不是停車場。這聽起來像科幻小說嗎?根據 Elon Musk 的說法,這個未來比我們想像的要近得多。 Tesla 的自動駕駛革命 Cybercab:無人駕駛的未來
Thumbnail
2024/09/08
想像一個世界,貨幣不再受制於政府印鈔機,而是由數學和密碼學保護。這就是比特幣的願景,也是 Samson Mow 畢生為之奮鬥的目標。
Thumbnail
2024/09/08
想像一個世界,貨幣不再受制於政府印鈔機,而是由數學和密碼學保護。這就是比特幣的願景,也是 Samson Mow 畢生為之奮鬥的目標。
Thumbnail
2024/09/06
2024 年 9 月 6 日,美國勞工部公布了最新的就業報告。這份報告揭示了就業市場的微妙變化,引發了市場對聯邦儲備局(Fed)可能調整利率政策的猜測。讓我們一起深入了解這份報告的關鍵內容及其潛在影響。
Thumbnail
2024/09/06
2024 年 9 月 6 日,美國勞工部公布了最新的就業報告。這份報告揭示了就業市場的微妙變化,引發了市場對聯邦儲備局(Fed)可能調整利率政策的猜測。讓我們一起深入了解這份報告的關鍵內容及其潛在影響。
Thumbnail
看更多
你可能也想看
Thumbnail
債券投資,不只是高資產族群的遊戲 在傳統的投資觀念中,海外債券(Overseas Bonds)常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻,讓許多想尋求穩定配息的小資族望而卻步。 然而,在股市波動劇烈的環境下,尋求穩定的美元現金流與被動收入成為許多投資人
Thumbnail
債券投資,不只是高資產族群的遊戲 在傳統的投資觀念中,海外債券(Overseas Bonds)常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻,讓許多想尋求穩定配息的小資族望而卻步。 然而,在股市波動劇烈的環境下,尋求穩定的美元現金流與被動收入成為許多投資人
Thumbnail
透過川普的近期債券交易揭露,探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響,以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺,如何讓小資族也能低門檻參與海外債券市場,實現「低門檻、低波動、固定收益」的務實投資方式。
Thumbnail
透過川普的近期債券交易揭露,探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響,以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺,如何讓小資族也能低門檻參與海外債券市場,實現「低門檻、低波動、固定收益」的務實投資方式。
Thumbnail
解析「債券」如何成為資產配置中的穩定錨,提供低風險高回報的投資選項。 藉由玉山證券的低門檻債券服務,投資者可輕鬆入手,平衡風險並穩定財務。
Thumbnail
解析「債券」如何成為資產配置中的穩定錨,提供低風險高回報的投資選項。 藉由玉山證券的低門檻債券服務,投資者可輕鬆入手,平衡風險並穩定財務。
Thumbnail
相較於波動較大的股票,債券能提供固定現金流,而玉山證券推出的小額債,更以1000 美元的低門檻,讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色,大幅降低投資難度,對於希望分散風險、建立穩定現金流的人來說,玉山小額債是一個值得嘗試的理財起點。
Thumbnail
相較於波動較大的股票,債券能提供固定現金流,而玉山證券推出的小額債,更以1000 美元的低門檻,讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色,大幅降低投資難度,對於希望分散風險、建立穩定現金流的人來說,玉山小額債是一個值得嘗試的理財起點。
Thumbnail
在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討
Thumbnail
在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 新模型和 Human Baselines 排名將不斷變化,Human Baselines 的位置自從基礎模型出現以來,它就不再具有多大意義了,這些排名只是表明經典 NL
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 新模型和 Human Baselines 排名將不斷變化,Human Baselines 的位置自從基礎模型出現以來,它就不再具有多大意義了,這些排名只是表明經典 NL
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在AI說書 - 從0開始 - 17中,介紹了大型語言模型 (LLM)世界裡面常用到的Token,現在我們來談談OpenAI的GPT模型如何利用Inference
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在AI說書 - 從0開始 - 17中,介紹了大型語言模型 (LLM)世界裡面常用到的Token,現在我們來談談OpenAI的GPT模型如何利用Inference
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 已經在AI說書 - 從0開始 - 12以及AI說書 - 從0開始 - 13中見識到TPU的威力了,現在我們把參數放大到真實大型語言模型的規模,看看運算時間的等級。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 已經在AI說書 - 從0開始 - 12以及AI說書 - 從0開始 - 13中見識到TPU的威力了,現在我們把參數放大到真實大型語言模型的規模,看看運算時間的等級。
Thumbnail
在AI時代中,GPT技術正在改變我們的生活。然而,SLM(小型語言模型)也開始受到關注,具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。
Thumbnail
在AI時代中,GPT技術正在改變我們的生活。然而,SLM(小型語言模型)也開始受到關注,具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。
Thumbnail
大型語言模型(Large Language Model,LLM)是一項人工智慧技術,其目的在於理解和生成人類語言,可將其想像成一種高階的「文字預測機器」,然而,它們並非真正理解語言。除了在上篇介紹的技巧可以協助我們在使用 LLM 時給予指示之外,今天我們會介紹使用 LLM 的框架。
Thumbnail
大型語言模型(Large Language Model,LLM)是一項人工智慧技術,其目的在於理解和生成人類語言,可將其想像成一種高階的「文字預測機器」,然而,它們並非真正理解語言。除了在上篇介紹的技巧可以協助我們在使用 LLM 時給予指示之外,今天我們會介紹使用 LLM 的框架。
Thumbnail
大型語言模型(LLM)是基於深度學習的自然語言處理模型,而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言,LMM 能夠處理跨模態的內容,並整合多種資料的能力,有望成為未來趨勢。
Thumbnail
大型語言模型(LLM)是基於深度學習的自然語言處理模型,而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言,LMM 能夠處理跨模態的內容,並整合多種資料的能力,有望成為未來趨勢。
Thumbnail
大語言模型(LLMs)對於任何對人工智能和自然語言處理感興趣的人來說都是一個令人興奮的領域。 這類模型,如GPT-4, 透過其龐大的數據集和複雜的參數設置, 提供了前所未有的語言理解和生成能力。 那麼,究竟是什麼讓這些模型「大」得如此不同呢?
Thumbnail
大語言模型(LLMs)對於任何對人工智能和自然語言處理感興趣的人來說都是一個令人興奮的領域。 這類模型,如GPT-4, 透過其龐大的數據集和複雜的參數設置, 提供了前所未有的語言理解和生成能力。 那麼,究竟是什麼讓這些模型「大」得如此不同呢?
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News