LLaMa2 「類開源」是否能引發三大公有雲重新洗牌?

更新於 發佈於 閱讀時間約 6 分鐘
投資理財內容聲明

Meta 無意中讓 Llama 1 被迫開源,結果收到超過 10 萬次訪問請求。這個意外的成功促使 Meta 宣布類開源 Llama 2,提供有限的免費訪問預訓練和微調版本,供研究和商業使用。

重點是,雖然 Llama 2 也可以在 AWS SageMaker、Hugging Face 和最近剛宣布的阿里雲上取得,但 Meta 特別將 Microsoft Azure 視為首選的合作夥伴 (原文:Preferred partnership with Microsoft)。

Meta 創辦人馬克祖克柏於文中點出 Microsoft 為 Preferred parntership

Meta 創辦人馬克祖克柏於文中點出 Microsoft 為 Preferred parntership

這對於一直在生成式 AI 戰場上還沒有顯著斬獲,存在感較低的雲端龍頭 AWS 是一個相當沉重的打擊。尤其 AWS 一向又被開發者視為對開源較友善的平台,商業模式偏好將各種開源工具與自家服務整合。(AWS 被指「露天開採」開源軟體,Amazon:因應客戶要求)

Meta 類開源 Llama 2,葫蘆裡賣的是甚麼藥?

那麼,為什麼 Meta 選擇了「類開源」方式釋放 Llama 2呢?當然,如 Meta 新聞稿所述,這是希望通過群眾外包的方式促進生成式 AI 的發展,造福社會等等,尤其是在近年來 Meta 飽受各種爭議的背景下,這樣策略贏得了開發者社群的喝彩。

然而,為什麼我們使用「類開源」而不是「開源」這個詞彙呢?這是因為在 Llama 2 的使用文件上有兩點限制並不符合社群所謂開源的精神,而我們也可以從這裡面推測 Meta 半開源Llama的真正目的。

  • 限制 1:不能拿 Llama 有關的資訊和跑出來的結果來優化 Llama 以外的模型
  • 限制 2:當月活躍人數 (MAU) 超過 7 億人時,需要取得 Meta 的授權

結合 1 和 2,這似乎是一種防守和進攻兼具的策略。

防守上,它阻止月活超過 7 億用戶的競爭對手使用 Llama 2 來強化自己 — 例如 Snapchat 最近突破了 7.5 億,Insider Intelligence 預測 TikTok 今年將突破 8.34 億,還有 Elon 聲稱 Twitter (or X) 有 5.4 億用戶。除了社交 app 的護城河外,此舉也同樣防禦雲端廠商拿該模型產出的結果優化自家獨有模型,或是比如AWS拿開源的Elasticsearch改成自己的Opensearch、拿開源的Spark以及Trino等資料分析工具變成自己的EMR等方式,將Llama2變成AWS的形狀,甚至是拿Llama2產出的資料去優化不知道何時會GA的Titan。

進攻上,它為任何希望使用 Llama 2 來減少訓練成本並加速實現貨幣化的新創企業戴上緊箍咒,在商業模式成功到逼近 7 億門檻時啟動養套殺陷阱卡。考慮到 Meta 過去被指控惡意併購 Instagram 的歷史,這樣的推論一點都不會令人意外。🛡️💡

為什麼 Azure 成為首選合作夥伴?

為什麼 Meta 特別需要在聲明稿特別突出 Microsoft Azure?事實上 Llama 2 可以在多個平台上取得,因此我覺得這個說法對於使用者選擇哪個雲端廠商應無實質影響。

但考慮到 Microsoft 一貫的行銷公關策略,這背後肯定有雙方的利益考量。最明顯的可能性是 Meta 能夠以優惠價獲得 Azure 的服務,或者優先取得 GPU 計算能力(Meta 的架構是所謂的Multi-hybrid Cloud,也就是除了自建的資料中心外,還有些服務會佈建在其他公有雲廠商,而 Meta 常常抱怨 AWS 的定價較為昂貴在業界並不是新聞)。💼📈

這對 Azure 和 OpenAI 合作會有什麼影響嗎?

作為雲服務提供商,Microsoft Azure 的理想狀況是擁有獨家使用 LLM 模型的能力,再加上各種商業和開源模型選擇,成為一個讓使用者可以在 Azure 上找到所需一切的市場。

Microsoft Azure 的唯一風險是 OpenAI 是否會因可能的資源排擠效應而選擇與其他雲端服務提供商聯手,這是值得持續關注的議題。日前有報導稱許多 OpenAI 的員工因不滿 Sam Altman 和 Microsoft Azure 走太近且讓利過多而離職。這可能意味著 OpenAI 的態度。

對 AWS 來說意味著什麼?等等,Amazon 有參戰嗎?

顯然,AWS 在這場生成式 AI 戰爭中遠遠落後。除了持續拖延推出 Bedrock 和自家的 Titan 模型外,他們的公開活動的討論大多圍繞著平台強大的安全性、基礎設施的豐富性,和歷史悠久的 AI DNA。AWS 的用戶群一直偏向開發者(Builder),而我們之前曾提到以開發者為核心的 Cloud Native 市場已經走到盡頭,接下來是偏向 Buyer 屬性的企業市場在雲端服務的使用上姍姍來遲。隨著 AWS 的步伐放緩,其他雲端供應商趕上後,許多技術上的差距已經足夠通過補貼縮小,AWS 也不再享有太多先行者優勢。

而隨著生成式 AI 的出現,我們發現有更多的 Builder 轉變為 Buyer,他們關心的是如何直接取用 LLM 服務,加上少許客製應用來快速貨幣化符合市場需求的解決方案。在這種情況下,擁有強大、獨有的模型,以及更多 Buyer 組成的市場,使得 Microsoft Azure 在這場戰爭中處於有利的位置。

同時,Google 也宣布,高達 70%的 AI 新創企業選擇了 GCP。因此,在生成式 AI 的第一回合,Buyer 更偏向 Microsoft Azure,而 Builder 更傾向於 GCP。

相較於 Microsoft 有 M365 及 GCP 有 Google Workspace 可以導入 AI 服務更貼近 business buyer以延展至其他商業需求,身為三大公有雲唯一沒有提供 OA (Office Automation)的 AWS 不能找到突破口扭轉這一趨勢,領先者的地位恐怕將面臨更前所未有的挑戰。🏭🛍️


留言
avatar-img
留言分享你的想法!
avatar-img
Q姐的科技外商指南的沙龍
7會員
4內容數
2023/07/07
找工作的時候,一份厲害的履歷就像是你的敲門磚,可以吸引 HR 和 Hiring manager 的目光,讓你從眾多應徵者中脫穎而出。這個標題寫最最最基本的履歷,事實上當你在業界行走一段時間,履歷說真的沒有佔那麼大的比例,但在 Q 姐沒人脈時,也是沒有靠內投,純靠著履歷取得 FANNG 的面試機會。
2023/07/07
找工作的時候,一份厲害的履歷就像是你的敲門磚,可以吸引 HR 和 Hiring manager 的目光,讓你從眾多應徵者中脫穎而出。這個標題寫最最最基本的履歷,事實上當你在業界行走一段時間,履歷說真的沒有佔那麼大的比例,但在 Q 姐沒人脈時,也是沒有靠內投,純靠著履歷取得 FANNG 的面試機會。
2023/06/21
當我加入第一份外商公司時,最大的文化衝擊是不就是賣產品嗎?為什麼一個任務需要這麼多人參與,並且似乎存在許多重疊的部分 (難怪有這麼多冗員可以裁),大家的工作分配究竟是如何進行的? 事實上,當一個業務團隊的配置充足且完整時,每個團隊成員都能為業務目標共同努力。不論是在業務橫向的產品線或是縱向的產業分布
2023/06/21
當我加入第一份外商公司時,最大的文化衝擊是不就是賣產品嗎?為什麼一個任務需要這麼多人參與,並且似乎存在許多重疊的部分 (難怪有這麼多冗員可以裁),大家的工作分配究竟是如何進行的? 事實上,當一個業務團隊的配置充足且完整時,每個團隊成員都能為業務目標共同努力。不論是在業務橫向的產品線或是縱向的產業分布
2023/06/17
想要進科技巨頭工作嗎,想要的話可以全部給你,去找吧! 我把所有的密技都放在這裡了!
Thumbnail
2023/06/17
想要進科技巨頭工作嗎,想要的話可以全部給你,去找吧! 我把所有的密技都放在這裡了!
Thumbnail
看更多
你可能也想看
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討
Thumbnail
在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討
Thumbnail
  這回來介紹 AWS 在目前生成式 AI 各種群魔亂舞下推出的 Bedrock 服務,其官網說明可以快速且傻瓜式的部屬生成式 AI 到你的應用上,看看是不是如其所述的功能強大。
Thumbnail
  這回來介紹 AWS 在目前生成式 AI 各種群魔亂舞下推出的 Bedrock 服務,其官網說明可以快速且傻瓜式的部屬生成式 AI 到你的應用上,看看是不是如其所述的功能強大。
Thumbnail
實踐AWS中使用Lambda來負責登入簽核及與OpenAI API溝通,並利用S3容器託管一個靜態網頁做為前端
Thumbnail
實踐AWS中使用Lambda來負責登入簽核及與OpenAI API溝通,並利用S3容器託管一個靜態網頁做為前端
Thumbnail
             Amazon Web Services(AWS)宣布致力於AI安全和研究的公司Anthropic的模型Claude 3系列將於Amazon Bedrock提供服務。Claude 3系列模型具備業界領先的準確性、效能、速度和成本優勢。這一進展將強化各種規模的企業
Thumbnail
             Amazon Web Services(AWS)宣布致力於AI安全和研究的公司Anthropic的模型Claude 3系列將於Amazon Bedrock提供服務。Claude 3系列模型具備業界領先的準確性、效能、速度和成本優勢。這一進展將強化各種規模的企業
Thumbnail
前言 在先前的文章中,我們探討了 IBM Watsonx 在客戶滿意度分析中的應用。今天,我們將利用 Google 的兩款大型語言模型(LLM)— flan-ul2 和 flan-t5-xxl,展示它們如何串聯起來生成關於特定主題的隨機問題和回答。 在這篇文章中,將使用 SimpleSequen
Thumbnail
前言 在先前的文章中,我們探討了 IBM Watsonx 在客戶滿意度分析中的應用。今天,我們將利用 Google 的兩款大型語言模型(LLM)— flan-ul2 和 flan-t5-xxl,展示它們如何串聯起來生成關於特定主題的隨機問題和回答。 在這篇文章中,將使用 SimpleSequen
Thumbnail
前言 在上一篇文章中,分享了第一次使用 IBM Watsonx 的經歷,以及我對 Prompt lab 功能的初步探索。繼續這個話題,本文將探討 Watsonx 平台對 Python SDK 的支持,以及實作幾個 LLM 的應用,這一特性為開發者提供了極大的便利,使得在此平台上進行開發和應用大型語
Thumbnail
前言 在上一篇文章中,分享了第一次使用 IBM Watsonx 的經歷,以及我對 Prompt lab 功能的初步探索。繼續這個話題,本文將探討 Watsonx 平台對 Python SDK 的支持,以及實作幾個 LLM 的應用,這一特性為開發者提供了極大的便利,使得在此平台上進行開發和應用大型語
Thumbnail
未來不管是Diffuser還是LLM的微調,都離不開LoRA這項技術,充分理解LoRA的本質是甚麼,CP值特別高。這項技術的理念其實在人工智慧領域行之有年,只是普遍沒有響亮的名字與非常痛的應用場合,在大模型參數量暴增的時刻,重要性被大幅凸顯出來。
Thumbnail
未來不管是Diffuser還是LLM的微調,都離不開LoRA這項技術,充分理解LoRA的本質是甚麼,CP值特別高。這項技術的理念其實在人工智慧領域行之有年,只是普遍沒有響亮的名字與非常痛的應用場合,在大模型參數量暴增的時刻,重要性被大幅凸顯出來。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News