大型語言模型(LLM)的基本概念

Andrej Karpathy 的大型語言模型實用指南（下）

Andrej Karpathy是AI領域的知名專家，曾在特斯拉和OpenAI工作，專注於深度學習和電腦視覺。影片中示範了大型語言模型（LLM）的實用應用，從基本互動到進階功能，如搜尋工具、檔案處理、自訂GPT、模型選擇、工具使用（如搜尋和深度研究）、程式碼撰寫、音視頻處理、圖像生成等。

#人工智慧#AI#方格新手

2025/03/03

Andrej Karpathy 的大型語言模型實用指南（下）

#人工智慧#AI#方格新手

2025/03/03

Andrej Karpathy 的大型語言模型實用指南（上）

#人工智慧#AI#科技公司

2025/03/03

Andrej Karpathy 的大型語言模型實用指南（上）

#人工智慧#AI#科技公司

2025/03/03

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 129 中說，Bidirectional Encoder Representations from Transformers (BER

2024/08/13

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

2024/08/13

AI說書 - 從0開始 - 116 | Google Trax 進行推論

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型，並在 AI說書 - 從0開始 - 115 載入權重並執行 Tokenizing，現

2024/08/06

AI說書 - 從0開始 - 116 | Google Trax 進行推論

2024/08/06

AI說書 - 從0開始 - 101

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Vaswani 等人 2017 年解決了設計 Transformer 時最困難的 NLP 問題之一，對於我們人機智慧設計師來說，機器翻譯的人類基準似乎遙不可及，然而，這

2024/07/23

AI說書 - 從0開始 - 101

2024/07/23

AI說書 - 從0開始 - 52

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformers for Natural Language Processing and Computer Vision, 2024 這本書中講 Attenti

2024/06/26

AI說書 - 從0開始 - 52

2024/06/26

AI說書 - 從0開始 - 18

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 17中，介紹了大型語言模型 (LLM)世界裡面常用到的Token，現在我們來談談OpenAI的GPT模型如何利用Inference

2024/06/15

AI說書 - 從0開始 - 18

2024/06/15

AI說書 - 從0開始 - 14

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。已經在AI說書 - 從0開始 - 12以及AI說書 - 從0開始 - 13中見識到TPU的威力了，現在我們把參數放大到真實大型語言模型的規模，看看運算時間的等級。

2024/06/12

AI說書 - 從0開始 - 14