學習大語言模型 101

王啟樺

2024/07/16 更新2024/07/16 發佈閱讀 2 分鐘

步驟 1: 計劃每天花點時間學習大語言模型的技術部分。

步驟 2: 選擇合適的教材。我選擇了Manning出版的《Build a Large Language Model (From Scratch)》，這本書有配套的程式碼和詳細的講解，是我信賴的學習素材。

步驟 3: 瀏覽教材中的程式碼範例。例如，今天我學習的第一段程式碼是：

```python

from importlib.metadata import version

import tiktoken

import torch

print("torch version:", version("torch"))

print("tiktoken version:", version("tiktoken"))

```

步驟 4: 理解程式碼中的新概念。對於我來說，第一個遇到的問題是`tiktoken`。

步驟 5: 探索新工具的功能。tiktoken 是OpenAI提供的快速開源的tokenizer。Tokenizer 的功能是將一組給定的「字符串 Text String」與「編碼 Encoding」，拆解成「符元表 List of Tokens」。

步驟 6: 練習使用工具並理解其輸出。舉例來說，輸入字符串"tiktoken is great!"，利用編碼器"cl100k_base"，tiktoken 就會回傳符元表 ["t", "ik", "token", " is", " great", "!"]。

步驟 7: 理解轉換過程及其重要性。將字符串轉換為符元表是因為大語言模型無法直接處理實際文字，需要將文字表現為「連續值向量 Continuous-Valued Vectors」，這一步轉換稱為「嵌入 Embedding」。

從小處著手。

逐步累積。

留言

留言分享你的想法！

王啟樺的沙龍

649會員

2.0K內容數

Outline as Content

王啟樺的沙龍的其他內容

2025/03/29

【碩博士生必學閱讀思維：從 Passive Consumption 到 Active Reading】

Passive Consumption（被動接收） vs. Active Reading（主動閱讀）｜真正讓你進化的閱讀差在這裡碩博士生每天都在讀論文、讀報告、讀教材，但大多數人其實只是「看過了」，不是「讀進去了」。讀很多卻吸收很少，記不起重點、寫不出心得，不是你不夠努力，而是你還停

2025/03/29

【碩博士生必學閱讀思維：從 Passive Consumption 到 Active Reading】

2025/03/27

【碩博士生必學：用 Obsidian 打造從閱讀到寫作的知識工作流，解決資料亂、想法卡、寫不出的問題】

2025/03/27

【碩博士生必學：用 Obsidian 打造從閱讀到寫作的知識工作流，解決資料亂、想法卡、寫不出的問題】

2025/01/29

中國 AI 這麼猛？美國的領先地位真的岌岌可危嗎？

4 個關鍵洞見 + 讓你看懂中美 AI 競爭 + 若不讀，你就可能錯失整個時代的最大機遇 AI 的發展速度，真的快到讓人心驚。我們常常以為美國在 AI 領域穩居頂尖，可現在中國的 AI 創新力好像開始迎頭趕上，這背後的原因是什麼？若我們沒有跟上這波 AI 變革，就可能被遠遠拋在後面，錯失技

2025/01/29

中國 AI 這麼猛？美國的領先地位真的岌岌可危嗎？

看更多

你可能也想看

剝洋蔥

「還可以啦」即是平庸的時代：中間長尾的消失與新商業模式

生產力爆發帶來的過剩，會讓過去的「還可以啦」成為最低標準。市場需求對於出類拔萃、獨一無二的需求還是存在，但是對於那些價格高度敏感，或是只需要穩定、便宜、還可以啦的需求端來說，AI 正在迅速取代這部分的供給，中間長尾的服務提供者被 AI 替換。

#AI#商業模式#創作者經濟

2025/12/21

剝洋蔥

「還可以啦」即是平庸的時代：中間長尾的消失與新商業模式

#AI#商業模式#創作者經濟

2025/12/21

VK科技閱讀時間

拒絕成為 AI 的貝爾實驗室！曾經堅持獨立的 DeepMind，如何走進 Google 帝國？

今年在 Google I/O 有幸看到 Hassabis 本人幾秒，DeepMind 和共同創辦人 Demis Hassabis 的這個題目，也一直都在待寫清單中。前陣子，在介紹 Founders Fund 時，發現 Demis Hassabis 當初在說服 Peter Thiel 投資 Dee

#Google#AlphaGo#ChatGPT

2025/12/09

VK科技閱讀時間

拒絕成為 AI 的貝爾實驗室！曾經堅持獨立的 DeepMind，如何走進 Google 帝國？

#Google#AlphaGo#ChatGPT

2025/12/09

開心做遊戲 Happy Making Game

GameMaker｜教學分類指南

這篇內容，介紹了知識傳遞的三種型態，以及GameMaker教學的分類方式。閱讀本篇指南，能夠理解GameMaker教學的整體規劃和知識結構。

#遊戲製作#遊戲開發#遊戲設計

2024/07/14

開心做遊戲 Happy Making Game

GameMaker｜教學分類指南

這篇內容，介紹了知識傳遞的三種型態，以及GameMaker教學的分類方式。閱讀本篇指南，能夠理解GameMaker教學的整體規劃和知識結構。

2024/07/14

高中數學主題練習—根式化簡

2024/06/25

高中數學主題練習—根式化簡

2024/06/25

試著設計你自己的工程清單吧！

2024/06/09

試著設計你自己的工程清單吧！

2024/06/09

DP演算法框架與推薦的DP學習路徑 (持續更新中)

DP特訓班的分類目錄與推薦的學習、練習順序

#python#leetcode#algorithm

2024/06/06

小松鼠的演算法樂園

DP演算法框架與推薦的DP學習路徑 (持續更新中)

DP特訓班的分類目錄與推薦的學習、練習順序

#python#leetcode#algorithm

2024/06/06

2024/04/16

2024/04/16

最近有新的訂閱者加入，想趁這個機會再分享一次學習心法與建議給第一次練習的讀者、同學們。如果你本身已經很熟練演算法，那隨機挑題目練習ok，可以測試觀念是否正確，並且驗證寫code的效率與正確程度。如果是剛畢業或還在學，以前沒有打過程式競賽。想開始有系統地增強演算法&資料結構的能力

#leetcode#python#algorithm

2024/04/10

小松鼠的演算法樂園

給訂閱者的學習心法&建議

#leetcode#python#algorithm

2024/04/10

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News