LLaMa2 「類開源」是否能引發三大公有雲重新洗牌?

更新於 發佈於 閱讀時間約 6 分鐘
  • 文內如有投資理財相關經驗、知識、資訊等內容,皆為創作者個人分享行為。
  • 有價證券、指數與衍生性商品之數據資料,僅供輔助說明之用,不代表創作者投資決策之推介及建議。
  • 閱讀同時,請審慎思考自身條件及自我決策,並應有為決策負責之事前認知。
  • 方格子希望您能從這些分享內容汲取投資養份,養成獨立思考的能力、判斷、行動,成就最適合您的投資理財模式。

Meta 無意中讓 Llama 1 被迫開源,結果收到超過 10 萬次訪問請求。這個意外的成功促使 Meta 宣布類開源 Llama 2,提供有限的免費訪問預訓練和微調版本,供研究和商業使用。

重點是,雖然 Llama 2 也可以在 AWS SageMaker、Hugging Face 和最近剛宣布的阿里雲上取得,但 Meta 特別將 Microsoft Azure 視為首選的合作夥伴 (原文:Preferred partnership with Microsoft)。

Meta 創辦人馬克祖克柏於文中點出 Microsoft 為 Preferred parntership

Meta 創辦人馬克祖克柏於文中點出 Microsoft 為 Preferred parntership

這對於一直在生成式 AI 戰場上還沒有顯著斬獲,存在感較低的雲端龍頭 AWS 是一個相當沉重的打擊。尤其 AWS 一向又被開發者視為對開源較友善的平台,商業模式偏好將各種開源工具與自家服務整合。(AWS 被指「露天開採」開源軟體,Amazon:因應客戶要求)

Meta 類開源 Llama 2,葫蘆裡賣的是甚麼藥?

那麼,為什麼 Meta 選擇了「類開源」方式釋放 Llama 2呢?當然,如 Meta 新聞稿所述,這是希望通過群眾外包的方式促進生成式 AI 的發展,造福社會等等,尤其是在近年來 Meta 飽受各種爭議的背景下,這樣策略贏得了開發者社群的喝彩。

然而,為什麼我們使用「類開源」而不是「開源」這個詞彙呢?這是因為在 Llama 2 的使用文件上有兩點限制並不符合社群所謂開源的精神,而我們也可以從這裡面推測 Meta 半開源Llama的真正目的。

  • 限制 1:不能拿 Llama 有關的資訊和跑出來的結果來優化 Llama 以外的模型
  • 限制 2:當月活躍人數 (MAU) 超過 7 億人時,需要取得 Meta 的授權

結合 1 和 2,這似乎是一種防守和進攻兼具的策略。

防守上,它阻止月活超過 7 億用戶的競爭對手使用 Llama 2 來強化自己 — 例如 Snapchat 最近突破了 7.5 億,Insider Intelligence 預測 TikTok 今年將突破 8.34 億,還有 Elon 聲稱 Twitter (or X) 有 5.4 億用戶。除了社交 app 的護城河外,此舉也同樣防禦雲端廠商拿該模型產出的結果優化自家獨有模型,或是比如AWS拿開源的Elasticsearch改成自己的Opensearch、拿開源的Spark以及Trino等資料分析工具變成自己的EMR等方式,將Llama2變成AWS的形狀,甚至是拿Llama2產出的資料去優化不知道何時會GA的Titan。

進攻上,它為任何希望使用 Llama 2 來減少訓練成本並加速實現貨幣化的新創企業戴上緊箍咒,在商業模式成功到逼近 7 億門檻時啟動養套殺陷阱卡。考慮到 Meta 過去被指控惡意併購 Instagram 的歷史,這樣的推論一點都不會令人意外。🛡️💡

為什麼 Azure 成為首選合作夥伴?

為什麼 Meta 特別需要在聲明稿特別突出 Microsoft Azure?事實上 Llama 2 可以在多個平台上取得,因此我覺得這個說法對於使用者選擇哪個雲端廠商應無實質影響。

但考慮到 Microsoft 一貫的行銷公關策略,這背後肯定有雙方的利益考量。最明顯的可能性是 Meta 能夠以優惠價獲得 Azure 的服務,或者優先取得 GPU 計算能力(Meta 的架構是所謂的Multi-hybrid Cloud,也就是除了自建的資料中心外,還有些服務會佈建在其他公有雲廠商,而 Meta 常常抱怨 AWS 的定價較為昂貴在業界並不是新聞)。💼📈

這對 Azure 和 OpenAI 合作會有什麼影響嗎?

作為雲服務提供商,Microsoft Azure 的理想狀況是擁有獨家使用 LLM 模型的能力,再加上各種商業和開源模型選擇,成為一個讓使用者可以在 Azure 上找到所需一切的市場。

Microsoft Azure 的唯一風險是 OpenAI 是否會因可能的資源排擠效應而選擇與其他雲端服務提供商聯手,這是值得持續關注的議題。日前有報導稱許多 OpenAI 的員工因不滿 Sam Altman 和 Microsoft Azure 走太近且讓利過多而離職。這可能意味著 OpenAI 的態度。

對 AWS 來說意味著什麼?等等,Amazon 有參戰嗎?

顯然,AWS 在這場生成式 AI 戰爭中遠遠落後。除了持續拖延推出 Bedrock 和自家的 Titan 模型外,他們的公開活動的討論大多圍繞著平台強大的安全性、基礎設施的豐富性,和歷史悠久的 AI DNA。AWS 的用戶群一直偏向開發者(Builder),而我們之前曾提到以開發者為核心的 Cloud Native 市場已經走到盡頭,接下來是偏向 Buyer 屬性的企業市場在雲端服務的使用上姍姍來遲。隨著 AWS 的步伐放緩,其他雲端供應商趕上後,許多技術上的差距已經足夠通過補貼縮小,AWS 也不再享有太多先行者優勢。

而隨著生成式 AI 的出現,我們發現有更多的 Builder 轉變為 Buyer,他們關心的是如何直接取用 LLM 服務,加上少許客製應用來快速貨幣化符合市場需求的解決方案。在這種情況下,擁有強大、獨有的模型,以及更多 Buyer 組成的市場,使得 Microsoft Azure 在這場戰爭中處於有利的位置。

同時,Google 也宣布,高達 70%的 AI 新創企業選擇了 GCP。因此,在生成式 AI 的第一回合,Buyer 更偏向 Microsoft Azure,而 Builder 更傾向於 GCP。

相較於 Microsoft 有 M365 及 GCP 有 Google Workspace 可以導入 AI 服務更貼近 business buyer以延展至其他商業需求,身為三大公有雲唯一沒有提供 OA (Office Automation)的 AWS 不能找到突破口扭轉這一趨勢,領先者的地位恐怕將面臨更前所未有的挑戰。🏭🛍️


留言0
查看全部
avatar-img
發表第一個留言支持創作者!
找工作的時候,一份厲害的履歷就像是你的敲門磚,可以吸引 HR 和 Hiring manager 的目光,讓你從眾多應徵者中脫穎而出。這個標題寫最最最基本的履歷,事實上當你在業界行走一段時間,履歷說真的沒有佔那麼大的比例,但在 Q 姐沒人脈時,也是沒有靠內投,純靠著履歷取得 FANNG 的面試機會。
當我加入第一份外商公司時,最大的文化衝擊是不就是賣產品嗎?為什麼一個任務需要這麼多人參與,並且似乎存在許多重疊的部分 (難怪有這麼多冗員可以裁),大家的工作分配究竟是如何進行的? 事實上,當一個業務團隊的配置充足且完整時,每個團隊成員都能為業務目標共同努力。不論是在業務橫向的產品線或是縱向的產業分布
想要進科技巨頭工作嗎,想要的話可以全部給你,去找吧! 我把所有的密技都放在這裡了!
找工作的時候,一份厲害的履歷就像是你的敲門磚,可以吸引 HR 和 Hiring manager 的目光,讓你從眾多應徵者中脫穎而出。這個標題寫最最最基本的履歷,事實上當你在業界行走一段時間,履歷說真的沒有佔那麼大的比例,但在 Q 姐沒人脈時,也是沒有靠內投,純靠著履歷取得 FANNG 的面試機會。
當我加入第一份外商公司時,最大的文化衝擊是不就是賣產品嗎?為什麼一個任務需要這麼多人參與,並且似乎存在許多重疊的部分 (難怪有這麼多冗員可以裁),大家的工作分配究竟是如何進行的? 事實上,當一個業務團隊的配置充足且完整時,每個團隊成員都能為業務目標共同努力。不論是在業務橫向的產品線或是縱向的產業分布
想要進科技巨頭工作嗎,想要的話可以全部給你,去找吧! 我把所有的密技都放在這裡了!
你可能也想看
Google News 追蹤
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Meta最近宣布將允許美國政府和承包商使用其AI模型Llama於軍事用途,標誌著其政策上的重大改變。Llama是一款開源AI技術,全球開發者均可使用,這使得中國等其他國家也開始利用此模型進行軍事應用。此決定引發對AI在軍事領域應用的倫理和安全風險的擔憂,尤其因開源性質使得技術監管困難。
Thumbnail
在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討
Thumbnail
隨著科技的進步和企業對數位轉型需求的增加,雲端計算成為現代資訊科技的核心。現今市場上有三大主要雲端平台,它們分別是 Amazon Web Services(AWS)、Microsoft Azure 和 Google Cloud Platform(GCP)。這些平台提供廣泛的服務和解決方案,滿足不同規
Thumbnail
Meta Platforms 正在探索推出其人工智慧助理 Meta AI 的付費版本的可能性,因為它的目標是在快速發展的人工智慧市場中與其他科技巨頭競爭。該付費版本擁有潛在的高級功能,並將競爭能力提高到新的水平。
接著載入Part 2需要的相關依賴,其分別為: from torch import cuda, bfloat16import import transformers 然後選擇我們要的Meta模型,這邊可以是Llama 2或者是Llama 3,後者是Meta最新釋出的模型。 同時我們也讓系統自
第一步先在Python環境中安裝本次專案需要用到的Library,相關指令如下: !pip install accelerate==0.21.0 !pip install transformers==4.31.0 !pip install tokenizers==0.13.3 !pip insta
Thumbnail
             Amazon Web Services(AWS)宣布致力於AI安全和研究的公司Anthropic的模型Claude 3系列將於Amazon Bedrock提供服務。Claude 3系列模型具備業界領先的準確性、效能、速度和成本優勢。這一進展將強化各種規模的企業
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Meta最近宣布將允許美國政府和承包商使用其AI模型Llama於軍事用途,標誌著其政策上的重大改變。Llama是一款開源AI技術,全球開發者均可使用,這使得中國等其他國家也開始利用此模型進行軍事應用。此決定引發對AI在軍事領域應用的倫理和安全風險的擔憂,尤其因開源性質使得技術監管困難。
Thumbnail
在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討
Thumbnail
隨著科技的進步和企業對數位轉型需求的增加,雲端計算成為現代資訊科技的核心。現今市場上有三大主要雲端平台,它們分別是 Amazon Web Services(AWS)、Microsoft Azure 和 Google Cloud Platform(GCP)。這些平台提供廣泛的服務和解決方案,滿足不同規
Thumbnail
Meta Platforms 正在探索推出其人工智慧助理 Meta AI 的付費版本的可能性,因為它的目標是在快速發展的人工智慧市場中與其他科技巨頭競爭。該付費版本擁有潛在的高級功能,並將競爭能力提高到新的水平。
接著載入Part 2需要的相關依賴,其分別為: from torch import cuda, bfloat16import import transformers 然後選擇我們要的Meta模型,這邊可以是Llama 2或者是Llama 3,後者是Meta最新釋出的模型。 同時我們也讓系統自
第一步先在Python環境中安裝本次專案需要用到的Library,相關指令如下: !pip install accelerate==0.21.0 !pip install transformers==4.31.0 !pip install tokenizers==0.13.3 !pip insta
Thumbnail
             Amazon Web Services(AWS)宣布致力於AI安全和研究的公司Anthropic的模型Claude 3系列將於Amazon Bedrock提供服務。Claude 3系列模型具備業界領先的準確性、效能、速度和成本優勢。這一進展將強化各種規模的企業