一. 引言

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

2024/08/13

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 129 中說，Bidirectional Encoder Representations from Transformers (BER

2024/06/25

AI說書 - 從0開始 - 50

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。這裡做 Embedding 與 Postional Encoding 的邏輯梳理與結論： Embedding 訓練方式：AI說書 - 從0開始 - 43 Embed

AI說書 - 從0開始 - 45

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 44說完 Embedding ，下一步就是闡述 Positional Embedding，其於原始 Transformer 架構中的角色

AI說書 - 從0開始 - 44

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 43中，闡述了 Embedding 的訓練方式，現在我們來看是否 Embedding 如我們預期般運作：假設我的目標句子是

2024/06/22

AI說書 - 從0開始 - 40

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 中的 Attention 機制是 'Word-to-Word' 操作，抑或是 'Token-to-Token' 操作，白話來講就是：「對於句子中

2024/06/16

C005｜符元ID如何幫助深度學習模型理解文本？

為了將輸入文本轉換成深度學習模型可以使用的嵌入向量，我們需要先將「輸入文本 Input Text」轉為「符元化文本 Tokenized Text」。而實際上「符元化文本 Tokenized Text」與「嵌入向量 Embedding Vector」之間，還有一個步驟稱為「符元

#大語言模型

C003｜為什麼大語言模型的嵌入需要這麼多維度？

大語言模型通常會生產自己的「嵌入 Embedding」作為部分的輸入層，並且在大語言模型的訓練途中不斷優化嵌入的方式，以對特定的任務特定的數據優化。而大語言模型使用的「嵌入維度 Embedding Dimension」通常是高維度的，例如最小的GPT-2模型有1億1千

#大語言模型 #GPT2 #GPT3

C002｜文本嵌入的效果為何在Obsidian中很不理想？

「嵌入 Embedding」這個概念，是指將「資料 Data」轉換為「向量 Vector」格式的過程。資料可以是影片的樣本，可以是音訊的樣本，可以是圖片的樣本，可以是文字的樣本。不同類型的樣本，可以透過相對應的預訓練神經網路模型，將資料

語言模型與文字表示以不同的方式來分析自然語言的詞語分佈及語意關係。本文章簡要介紹了語言模型、Word2vec、FastText、GloVe和Transformer等技術，並提供了實際的應用參考點，幫助讀者深入理解自然語言處理的技術。

#模型 #語言 #輸入

多語自學者

2024/01/06

【語言的科學】語言的「內化」，中間到底需經過哪些心路歷程？

#語言 #語文 #語言學

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

2024/08/13

2024/06/25

AI說書 - 從0開始 - 50

AI說書 - 從0開始 - 45

AI說書 - 從0開始 - 44

2024/06/22

AI說書 - 從0開始 - 40

2024/06/16

C005｜符元ID如何幫助深度學習模型理解文本？

#大語言模型

C003｜為什麼大語言模型的嵌入需要這麼多維度？

#大語言模型 #GPT2 #GPT3