Meta 使用了那些資料來訓練 Llama 2 模型？

袁如陵專利師

2025/08/03 更新2024/04/19 發佈閱讀 1 分鐘

Llama 2模型的訓練資料量比前一代 Llama 的訓練資料增加了40%。其中以英文內容佔絕大多數，其他語言則皆低於 0.2%，中文則佔了 0.13%。

raw-image

擷取自 Meta 所發布之論文 Llama 2: Open Foundation and Fine-Tuned Chat Models

值得注意的是，Meta 並未如前一代 Llama 模型一樣，發佈詳細的訓練內容，這引起許多海外媒體的關注。外界大多猜測 Meta 不願透漏訓練材料的原因，除了商業機密之外，也是因為潛在的著作權議題。

然而一切終將水落石出。根據多家媒體報導，Meta 在美國的一起著作權訴訟中，已承認使用了 Books3 來訓練Llama 2模型。

raw-image

拜託，今天可以不要訓練嗎？ Image: Wikimedia

留言

留言分享你的想法！

IP聊天室

3會員

140內容數

喜愛學東學西，總說略懂略懂。希望簡單的文字，讓更多人了解智慧財產權。相信觀點的碰撞，才能帶來成長。

IP聊天室的其他內容

2024/04/18

「C4 資料集」是什麼？

C4（Colossal Clean Crawled Corpus）資料集是由 Google 所發佈，用於訓練人工智慧（AI）模型的大型資料集，其中包含了大量的網路文字資料，讓演算法能夠更好地理解人類的語言並進行自然語言處理（Natural Language Processing，NLP）。C4 資料

2024/04/18

「C4 資料集」是什麼？

C4（Colossal Clean Crawled Corpus）資料集是由 Google 所發佈，用於訓練人工智慧（AI）模型的大型資料集，其中包含了大量的網路文字資料，讓演算法能夠更好地理解人類的語言並進行自然語言處理（Natural Language Processing，NLP）。C4 資料

2024/04/18

「訓練資料集 WebText2」是什麼？

WebText2 是由 OpenAI 公司所建立的一個大型資料集，用來訓練他們的 GPT-3 語言模型。WebText2 是 WebText 資料集的延伸版本，而 WebText 是用來訓練 GPT-2 模型的資料集。 Image: Flickr (CC BY 2.0 DEED) WebTe

2024/04/18

「訓練資料集 WebText2」是什麼？

WebText2 是由 OpenAI 公司所建立的一個大型資料集，用來訓練他們的 GPT-3 語言模型。WebText2 是 WebText 資料集的延伸版本，而 WebText 是用來訓練 GPT-2 模型的資料集。 Image: Flickr (CC BY 2.0 DEED) WebTe

2024/04/18

「古騰堡計畫」是什麼？

「古騰堡計畫」（Project Gutenberg）是由美國人麥克．哈特（Michael Hart）於 1971 年發起的一項非營利計畫，旨在將各種語言的經典作品數位化，製作成免費的電子書供大眾下載閱讀。它是世界上最早的數位圖書館，致力於電子書的創作與發行。 Image: Flickr 古騰

2024/04/18

「古騰堡計畫」是什麼？

「古騰堡計畫」（Project Gutenberg）是由美國人麥克．哈特（Michael Hart）於 1971 年發起的一項非營利計畫，旨在將各種語言的經典作品數位化，製作成免費的電子書供大眾下載閱讀。它是世界上最早的數位圖書館，致力於電子書的創作與發行。 Image: Flickr 古騰

你可能也想看

Learn AI 不 BI

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 129 中說，Bidirectional Encoder Representations from Transformers (BER

#AI#ai#PromptEngineering

2024/08/13

Learn AI 不 BI

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 129 中說，Bidirectional Encoder Representations from Transformers (BER

#AI#ai#PromptEngineering

2024/08/13

Learn AI 不 BI

AI說書 - 從0開始 - 128 | Transformer 和 BERT 模型參數比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 127 中提及： Transformer 的關鍵參數為：原始 Transformer 模型中，左圖的 N = 6 原始 Tran

#AI#ai#PromptEngineering

2024/08/12

Learn AI 不 BI

AI說書 - 從0開始 - 128 | Transformer 和 BERT 模型參數比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 127 中提及： Transformer 的關鍵參數為：原始 Transformer 模型中，左圖的 N = 6 原始 Tran

#AI#ai#PromptEngineering

2024/08/12

Learn AI 不 BI

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 39 至 AI說書 - 從0開始 - 69 的第二章內容，我們拿 Encoder 出來看：幾點注意如下： BERT 模型使用 M

#AI#ai#PromptEngineering

2024/08/11

Learn AI 不 BI

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 39 至 AI說書 - 從0開始 - 69 的第二章內容，我們拿 Encoder 出來看：幾點注意如下： BERT 模型使用 M

#AI#ai#PromptEngineering

2024/08/11

Alan Tseng的沙龍

超簡單! 一文理解如何使用私有大型語言模型LLM - Ollama＋Open WebUI篇

本文會教你如何以最簡單方式使用Ollama＋Open WebUI

#ollama#llm#大型語言模型

2024/07/19

Alan Tseng的沙龍

超簡單! 一文理解如何使用私有大型語言模型LLM - Ollama＋Open WebUI篇

本文會教你如何以最簡單方式使用Ollama＋Open WebUI

#ollama#llm#大型語言模型

2024/07/19

Learn AI 不 BI

AI說書 - 從0開始 - 86

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 82 到 AI說書 - 從0開始 - 85 的說明，有一個很重要的結論：最適合您的模型不一定是排行榜上最好的模型，您需要學習 NLP 評

#AI#ai#PromptEngineering

2024/07/13

Learn AI 不 BI

AI說書 - 從0開始 - 86

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 82 到 AI說書 - 從0開始 - 85 的說明，有一個很重要的結論：最適合您的模型不一定是排行榜上最好的模型，您需要學習 NLP 評

#AI#ai#PromptEngineering

2024/07/13

Learn AI 不 BI

AI說書 - 從0開始 - 85

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。新模型和 Human Baselines 排名將不斷變化，Human Baselines 的位置自從基礎模型出現以來，它就不再具有多大意義了，這些排名只是表明經典 NL

#AI#ai#PromptEngineering

2024/07/12

Learn AI 不 BI

AI說書 - 從0開始 - 85

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。新模型和 Human Baselines 排名將不斷變化，Human Baselines 的位置自從基礎模型出現以來，它就不再具有多大意義了，這些排名只是表明經典 NL

#AI#ai#PromptEngineering

2024/07/12

Learn AI 不 BI

AI說書 - 從0開始 - 84

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。繼 AI說書 - 從0開始 - 82 與 xxx ，我們談論了衡量 AI 模型的方式，那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時，需要

#AI#ai#PromptEngineering

2024/07/12

Learn AI 不 BI

AI說書 - 從0開始 - 84

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。繼 AI說書 - 從0開始 - 82 與 xxx ，我們談論了衡量 AI 模型的方式，那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時，需要

#AI#ai#PromptEngineering

2024/07/12

Learn AI 不 BI

AI說書 - 從0開始 - 82

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 可以透過繼承預訓練模型 (Pretrained Model) 來微調 (Fine-Tune) 以執行下游任務。 Pretrained Mo

#AI#ai#PromptEngineering

2024/07/10

Learn AI 不 BI

AI說書 - 從0開始 - 82

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 可以透過繼承預訓練模型 (Pretrained Model) 來微調 (Fine-Tune) 以執行下游任務。 Pretrained Mo

#AI#ai#PromptEngineering

2024/07/10

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News