學習大語言模型 101

王啟樺

2024/07/16 更新2024/07/16 發佈閱讀 2 分鐘

步驟 1: 計劃每天花點時間學習大語言模型的技術部分。

步驟 2: 選擇合適的教材。我選擇了Manning出版的《Build a Large Language Model (From Scratch)》，這本書有配套的程式碼和詳細的講解，是我信賴的學習素材。

步驟 3: 瀏覽教材中的程式碼範例。例如，今天我學習的第一段程式碼是：

```python

from importlib.metadata import version

import tiktoken

import torch

print("torch version:", version("torch"))

print("tiktoken version:", version("tiktoken"))

```

步驟 4: 理解程式碼中的新概念。對於我來說，第一個遇到的問題是`tiktoken`。

步驟 5: 探索新工具的功能。tiktoken 是OpenAI提供的快速開源的tokenizer。Tokenizer 的功能是將一組給定的「字符串 Text String」與「編碼 Encoding」，拆解成「符元表 List of Tokens」。

步驟 6: 練習使用工具並理解其輸出。舉例來說，輸入字符串"tiktoken is great!"，利用編碼器"cl100k_base"，tiktoken 就會回傳符元表 ["t", "ik", "token", " is", " great", "!"]。

步驟 7: 理解轉換過程及其重要性。將字符串轉換為符元表是因為大語言模型無法直接處理實際文字，需要將文字表現為「連續值向量 Continuous-Valued Vectors」，這一步轉換稱為「嵌入 Embedding」。

從小處著手。

逐步累積。

留言

留言分享你的想法！

王啟樺的沙龍

638會員

2.0K內容數

Outline as Content

王啟樺的沙龍的其他內容

2025/03/29

【碩博士生必學閱讀思維：從 Passive Consumption 到 Active Reading】

Passive Consumption（被動接收） vs. Active Reading（主動閱讀）｜真正讓你進化的閱讀差在這裡碩博士生每天都在讀論文、讀報告、讀教材，但大多數人其實只是「看過了」，不是「讀進去了」。讀很多卻吸收很少，記不起重點、寫不出心得，不是你不夠努力，而是你還停

2025/03/29

【碩博士生必學閱讀思維：從 Passive Consumption 到 Active Reading】

2025/03/27

【碩博士生必學：用 Obsidian 打造從閱讀到寫作的知識工作流，解決資料亂、想法卡、寫不出的問題】

2025/03/27

【碩博士生必學：用 Obsidian 打造從閱讀到寫作的知識工作流，解決資料亂、想法卡、寫不出的問題】

2025/01/29

中國 AI 這麼猛？美國的領先地位真的岌岌可危嗎？

4 個關鍵洞見 + 讓你看懂中美 AI 競爭 + 若不讀，你就可能錯失整個時代的最大機遇 AI 的發展速度，真的快到讓人心驚。我們常常以為美國在 AI 領域穩居頂尖，可現在中國的 AI 創新力好像開始迎頭趕上，這背後的原因是什麼？若我們沒有跟上這波 AI 變革，就可能被遠遠拋在後面，錯失技

2025/01/29

中國 AI 這麼猛？美國的領先地位真的岌岌可危嗎？

看更多

你可能也想看

開心做遊戲 Happy Making Game

GameMaker｜教學分類指南

這篇內容，介紹了知識傳遞的三種型態，以及GameMaker教學的分類方式。閱讀本篇指南，能夠理解GameMaker教學的整體規劃和知識結構。

#遊戲製作#遊戲開發#遊戲設計

2024/07/14

開心做遊戲 Happy Making Game

GameMaker｜教學分類指南

這篇內容，介紹了知識傳遞的三種型態，以及GameMaker教學的分類方式。閱讀本篇指南，能夠理解GameMaker教學的整體規劃和知識結構。

2024/07/14

高中數學主題練習—根式化簡

2024/06/25

高中數學主題練習—根式化簡

2024/06/25

試著設計你自己的工程清單吧！

2024/06/09

試著設計你自己的工程清單吧！

2024/06/09

DP演算法框架與推薦的DP學習路徑 (持續更新中)

DP特訓班的分類目錄與推薦的學習、練習順序

#python#leetcode#algorithm

2024/06/06

小松鼠的演算法樂園

DP演算法框架與推薦的DP學習路徑 (持續更新中)

DP特訓班的分類目錄與推薦的學習、練習順序

#python#leetcode#algorithm

2024/06/06

2024/04/16

2024/04/16

最近有新的訂閱者加入，想趁這個機會再分享一次學習心法與建議給第一次練習的讀者、同學們。如果你本身已經很熟練演算法，那隨機挑題目練習ok，可以測試觀念是否正確，並且驗證寫code的效率與正確程度。如果是剛畢業或還在學，以前沒有打過程式競賽。想開始有系統地增強演算法&資料結構的能力

#leetcode#python#algorithm

2024/04/10

小松鼠的演算法樂園

給訂閱者的學習心法&建議

#leetcode#python#algorithm

2024/04/10

程式貓咪

1. 演算法與運算

解決電腦上遇到的問題、證明正確性、探討效率並且很著重溝通，說服別人你做的事是正確且有效率的。內容：計算模型、資料結構介紹、演算法介紹、時間複雜度介紹。

2024/01/23

2024/01/23

編輯的基本功，是對文字的敏感度。

2024/01/05

編輯的基本功，是對文字的敏感度。

2024/01/05

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News