DA的美股日記

Llama模型

DA的美股日記

更新於 2025/01/27發佈於 2025/01/27閱讀時間約 2 分鐘

投資理財內容聲明

截至2025年1月，Meta的Llama模型已發展至Llama 3.3版本，並計劃於2025年內推出下一代Llama 4模型。

Llama的發展進程

Llama 1 (2023年2月)
- 初代模型，專注於開放研究用途。僅提供非商業許可，參數規模從7B到70B。
Llama 2 (2023年7月)
- 與微軟合作推出，首次允許部分商業用途。提供7B、13B和70B參數版本，並引入指令微調模型（instruction-tuned models）。增加了40%的訓練數據，提升性能。
Llama 3 系列 (2024年)
- Llama 3 (2024年4月):提供8B和70B參數版本，訓練於15萬億tokens。在多語言支持和推理能力上超越競爭對手。Llama 3.1 (2024年7月):推出405B參數版本，是全球首個開源的超大規模模型。支持多語言對話、工具使用，以及128,000 tokens的長上下文處理能力。Llama 3.2 (2024年9月):增加多模態支持（文本與圖像），並推出適合移動設備的輕量化模型。Llama 3.3 (2024年12月):提供70B參數版本，以更低資源需求達到與405B模型相近的性能。

未來計劃：Llama 4 (2025年)

預計在2025年初推出，將分階段發布多個版本。
重點提升推理能力和語音交互功能。
訓練規模將使用超過10萬個NVIDIA H100 GPU，比現有任何模型規模更大。
新增模態和更快性能，進一步擴展應用場景。

總結

目前Llama已發展至Llama 3.3版本，並在多語言支持、長上下文處理、多模態能力等方面取得顯著進步。Meta正積極準備推出Llama 4，以進一步提升推理和語音交互能力，保持其在開源AI領域的領先地位。

留言

留言分享你的想法！

DA的美股日記

6會員

294內容數

DA的美股日記的其他內容

2025/04/26

什麼是「貨幣市場基金」？

✅ 什麼是「貨幣市場基金」？貨幣市場基金是一種非常低風險的投資工具，主要投資在：短期國庫券（T-bills）銀行定存短期政府或高信評企業的商業票據它的特性是：收益穩定但很低隨時可以提領（高度流動性）是現金的替代品，投資人常用來暫停觀望、停泊資金 📉 如果「大量流

2025/04/26

什麼是「貨幣市場基金」？

✅ 什麼是「貨幣市場基金」？貨幣市場基金是一種非常低風險的投資工具，主要投資在：短期國庫券（T-bills）銀行定存短期政府或高信評企業的商業票據它的特性是：收益穩定但很低隨時可以提領（高度流動性）是現金的替代品，投資人常用來暫停觀望、停泊資金 📉 如果「大量流

2025/03/29

DPI（Disposable Personal Income）

✅ DPI 是什麼？它是指一個人收到的總收入扣除個人所得稅後，真正可以自由支配來消費或儲蓄的收入。 🔍 舉例說明：假設你這個月收入為 $5,000 你繳了 $1,000 的所得稅那你的 DPI 就是：這 $4,000 就是你可以拿來：消費（吃飯、旅遊、買衣服）

2025/03/29

DPI（Disposable Personal Income）

✅ DPI 是什麼？它是指一個人收到的總收入扣除個人所得稅後，真正可以自由支配來消費或儲蓄的收入。 🔍 舉例說明：假設你這個月收入為 $5,000 你繳了 $1,000 的所得稅那你的 DPI 就是：這 $4,000 就是你可以拿來：消費（吃飯、旅遊、買衣服）

2025/03/29

PCE物價指數（PCE Price Index）和個人支出（Personal Outlays）混淆

🔹 1. PCE Price Index（個人消費支出物價指數）是「物價變化率」的指標 PCE = Personal Consumption Expenditures PCE Price Index 反映的是「你買的東西變貴了多少？」 ✅ 舉例說明：假設你這個月花了100元買東西，跟上個

2025/03/29

PCE物價指數（PCE Price Index）和個人支出（Personal Outlays）混淆

🔹 1. PCE Price Index（個人消費支出物價指數）是「物價變化率」的指標 PCE = Personal Consumption Expenditures PCE Price Index 反映的是「你買的東西變貴了多少？」 ✅ 舉例說明：假設你這個月花了100元買東西，跟上個

你可能也想看

TN科技筆記(TechNotes)的沙龍

Mistral Small 3.1：超越Google Gemma 3，輕量化開源 AI 模型的又一突破

開源模型Mistral Small 3.1 於 2025 年 3 月 18 日推出，以 24 億參數實現高效能，超越 Gemma 3 等模型。其多模態功能、128,000 Token 上下文窗口與每秒 150 Token 的推理速度，使其在多項任務中表現出色，並能在消費級硬體上運行展現驚人效率。

#人工智慧#AI#科技公司

2025/03/20

TN科技筆記(TechNotes)的沙龍

Mistral Small 3.1：超越Google Gemma 3，輕量化開源 AI 模型的又一突破

開源模型Mistral Small 3.1 於 2025 年 3 月 18 日推出，以 24 億參數實現高效能，超越 Gemma 3 等模型。其多模態功能、128,000 Token 上下文窗口與每秒 150 Token 的推理速度，使其在多項任務中表現出色，並能在消費級硬體上運行展現驚人效率。

#人工智慧#AI#科技公司

2025/03/20

Learn AI 不 BI

AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 GPT-4 等大型語言模型 (LLM) 可以解釋語言模型中的神經元，OpenAI 創建了直覺的介面並於 2023 年 5 月公開。人工智慧的歷史在非常短的時間內已經達到

#AI#ai#PromptEngineering

2024/12/23

Learn AI 不 BI

AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 GPT-4 等大型語言模型 (LLM) 可以解釋語言模型中的神經元，OpenAI 創建了直覺的介面並於 2023 年 5 月公開。人工智慧的歷史在非常短的時間內已經達到

#AI#ai#PromptEngineering

2024/12/23

悠緣船帆的沙龍

元宇宙巨頭的AI野心：Meta 推出Llama 3.1 模型，挑戰 AI 霸主地位

在AI領域的競爭中，Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1，這不僅是免費的，而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪，但它真的能與OpenAI和Google等巨頭抗衡嗎？讓我們一起深入探討

#人工智能#Llama#Meta

2024/07/25

悠緣船帆的沙龍

元宇宙巨頭的AI野心：Meta 推出Llama 3.1 模型，挑戰 AI 霸主地位

在AI領域的競爭中，Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1，這不僅是免費的，而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪，但它真的能與OpenAI和Google等巨頭抗衡嗎？讓我們一起深入探討

#人工智能#Llama#Meta

2024/07/25

朵小芸的草味沙龍

SLM是什麼？探索小型語言模型的未來趨勢

在AI時代中，GPT技術正在改變我們的生活。然而，SLM（小型語言模型）也開始受到關注，具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。

#SLM#LLM#大語言模型

2024/06/06

朵小芸的草味沙龍

SLM是什麼？探索小型語言模型的未來趨勢

在AI時代中，GPT技術正在改變我們的生活。然而，SLM（小型語言模型）也開始受到關注，具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。

#SLM#LLM#大語言模型

2024/06/06

Marcos的方格子

大型語言模型常用的提詞框架 | Coursera 課程回顧(下)

大型語言模型（Large Language Model，LLM）是一項人工智慧技術，其目的在於理解和生成人類語言，可將其想像成一種高階的「文字預測機器」，然而，它們並非真正理解語言。除了在上篇介紹的技巧可以協助我們在使用 LLM 時給予指示之外，今天我們會介紹使用 LLM 的框架。

#PromptPattern#LLM#ChatGPT

2024/03/09

Marcos的方格子

大型語言模型常用的提詞框架 | Coursera 課程回顧(下)

大型語言模型（Large Language Model，LLM）是一項人工智慧技術，其目的在於理解和生成人類語言，可將其想像成一種高階的「文字預測機器」，然而，它們並非真正理解語言。除了在上篇介紹的技巧可以協助我們在使用 LLM 時給予指示之外，今天我們會介紹使用 LLM 的框架。

#PromptPattern#LLM#ChatGPT

2024/03/09

AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

大型語言模型(LLM)是基於深度學習的自然語言處理模型，而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言，LMM 能夠處理跨模態的內容，並整合多種資料的能力，有望成為未來趨勢。

#ChatGPT#AI#人工智慧

2024/02/24

AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

大型語言模型(LLM)是基於深度學習的自然語言處理模型，而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言，LMM 能夠處理跨模態的內容，並整合多種資料的能力，有望成為未來趨勢。

#ChatGPT#AI#人工智慧

2024/02/24

私大王牌教授 (私人大學ACE) feat. mr gary

66個大型語言模型LLM經典論文

2023/12/31

私大王牌教授 (私人大學ACE) feat. mr gary

66個大型語言模型LLM經典論文

2023/12/31

無限智慧學院的沙龍

三分鐘內由上帝視角理解LoRA，讓大模型成為達文西的秘訣

未來不管是Diffuser還是LLM的微調，都離不開LoRA這項技術，充分理解LoRA的本質是甚麼，CP值特別高。這項技術的理念其實在人工智慧領域行之有年，只是普遍沒有響亮的名字與非常痛的應用場合，在大模型參數量暴增的時刻，重要性被大幅凸顯出來。

#LoRA#LowRank#finetune

2023/12/02

無限智慧學院的沙龍

三分鐘內由上帝視角理解LoRA，讓大模型成為達文西的秘訣

未來不管是Diffuser還是LLM的微調，都離不開LoRA這項技術，充分理解LoRA的本質是甚麼，CP值特別高。這項技術的理念其實在人工智慧領域行之有年，只是普遍沒有響亮的名字與非常痛的應用場合，在大模型參數量暴增的時刻，重要性被大幅凸顯出來。

#LoRA#LowRank#finetune

2023/12/02

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News