AI說書 - 從0開始 - 128 | Transformer 和 BERT 模型參數比較

LearnAI

2024/08/12閱讀時間約 1 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

在 AI說書 - 從0開始 - 127 中提及：

Transformer 的關鍵參數為：

原始 Transformer 模型中，左圖的 N = 6
原始 Transformer 模型中，輸入 Multi-Head Attention 的維度是 [Token數, 512]，記為 d_model = 512
原始 Transformer 模型中，Multi-Head Attention 有八個 Head，記為 A = 8
原始 Transformer 模型中，Attention Head 的維度是 64，記為 d_k = 64

現在我們來闡述 Bidirectional Encoder Representations from Transformers (BERT) 模型的關鍵參數：

BERT_Base 模型的 N = 12
BERT_Base 模型的 d_model = 768
BERT_Base 模型的 A = 12
BERT_Base 模型的 d_k = 64

還有一種比較大模型的 BERT，其關鍵參數為：

BERT_Large 模型的 N = 24
BERT_Large 模型的 d_model = 1024
BERT_Large 模型的 A = 16
BERT_Large 模型的 d_k = 64

Transformer、BERT_Base 與 BERT_Large 的模型比較如下圖所示：

Learn AI 不 BI三分鐘學AIAI從0開始-第五章

Learn AI 不 BI

156會員

393內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言0

查看全部

發表第一個留言支持創作者！

Learn AI 不 BI 的其他內容

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 39 至 AI說書 - 從0開始 - 69 的第二章內容，我們拿 Encoder 出來看：幾點注意如下： BERT 模型使用 M

AI說書 - 從0開始 - 128 | Transformer 和 BERT 模型參數比較

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

AI說書 - 從0開始 - 126 | BERT 引言

AI說書 - 從0開始 - 125 | 第五章目錄

AI說書 - 從0開始 - 122 | 第四章額外閱讀項目

AI說書 - 從0開始 - 121 | Back-Translation 使用情境

AI說書 - 從0開始 - 120 | Google Gemini 使用

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

AI說書 - 從0開始 - 126 | BERT 引言

AI說書 - 從0開始 - 125 | 第五章目錄

AI說書 - 從0開始 - 122 | 第四章額外閱讀項目

AI說書 - 從0開始 - 121 | Back-Translation 使用情境

AI說書 - 從0開始 - 120 | Google Gemini 使用

你可能也想看

「天天秋嗨嗨」：vocus 秋季徵文，五大主題 & 獎品登場！

美國大選『終局之戰』（Endgame）即將展開， 美股將迎來新世紀？（上篇：模型推導寶座花落誰家？）

如果這個世界有神，那祂一定姓李名相赫｜矮袋鼠律師

AI說書 - 從0開始 - 125 | 第五章目錄

AI說書 - 從0開始 - 122 | 第四章額外閱讀項目

AI說書 - 從0開始 - 116 | Google Trax 進行推論

AI說書 - 從0開始 - 115 | Google Trax 載入預訓練權重

AI說書 - 從0開始 - 102

AI說書 - 從0開始 - 93

AI說書 - 從0開始 - 42

AI說書 - 從0開始 - 41

AI說書 - 從0開始 - 35

AI說書 - 從0開始 - 16

「天天秋嗨嗨」：vocus 秋季徵文，五大主題 & 獎品登場！

美國大選『終局之戰』（Endgame）即將展開， 美股將迎來新世紀？（上篇：模型推導寶座花落誰家？）

如果這個世界有神，那祂一定姓李名相赫｜矮袋鼠律師

AI說書 - 從0開始 - 125 | 第五章目錄

AI說書 - 從0開始 - 122 | 第四章額外閱讀項目

AI說書 - 從0開始 - 116 | Google Trax 進行推論

AI說書 - 從0開始 - 115 | Google Trax 載入預訓練權重

AI說書 - 從0開始 - 102

AI說書 - 從0開始 - 93

AI說書 - 從0開始 - 42

AI說書 - 從0開始 - 41

AI說書 - 從0開始 - 35

AI說書 - 從0開始 - 16

美國大選『終局之戰』（Endgame）即將展開，美股將迎來新世紀？（上篇：模型推導寶座花落誰家？）

美國大選『終局之戰』（Endgame）即將展開，美股將迎來新世紀？（上篇：模型推導寶座花落誰家？）