AI說書 - 從0開始 - 489 | Vision Transformer 特徵提取器核心理念說明

2025/08/06 更新2025/08/06 發佈閱讀 2 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

我們將建立一個特徵提取器模擬器，以說明圖像如何被分割為區塊並成為 Transformer 的輸入，Vision Transformer（ViT）模型將原始輸入圖像分割成 16 x 16 像素的小方塊網格，這些區塊被視為標準 Transformer 模型中與詞彙（如句子中的詞）等效的「標記」。

在接下來的程式碼中，使用 PyTorch 的 unfold 函數從大小為 224 x 224 的輸入圖像中創建區塊，此函數從輸入張量（在此情況下是圖像）中提取滑動的區域塊，可以將其視為將圖像切分成小的方形區塊，Patch_Size 參數定義了這些區塊的大小。

接著，每個區塊被展平成一維向量，所有這些向量形成一個二維輸入矩陣，可以提供給Transformer 模型，該矩陣的每一 Row 對應於單個區塊的向量，區塊數量為 224 / 16 * 224 / 16 = 196 個區塊，這些區塊構成了 Transformer 模型的詞彙，就如同文字模型的字典。

Learn AI 不 BI三分鐘學AI (3)AI從0開始-十六章

留言

留言分享你的想法！

Learn AI 不 BI

244會員

961內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2025/08/05

AI說書 - 從0開始 - 488 | Vision Transformer 輸入資料之圖片檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。為了解釋 ViT 模型，首先先下載圖片，方便後續使用： from IPython.display import Image !curl -L https://raw.

2025/08/05

AI說書 - 從0開始 - 488 | Vision Transformer 輸入資料之圖片檢視

2025/08/04

AI說書 - 從0開始 - 487 | Vision Transformer 介紹

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。類似單詞的圖像序列可以適配於 Transformer 中，問題在於，它們仍然是圖像，Google Research 決定使用一種混合輸入模型來完成這項工作，如下圖所示：

2025/08/04

AI說書 - 從0開始 - 487 | Vision Transformer 介紹

2025/08/02

AI說書 - 從0開始 - 486 | Vision Transformer 介紹

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Dosovitskiy 等人於 2021 年在其論文標題中概括了他們設計的視覺 Transformer 架構的本質：一張圖像相當於 16 x 16 個單詞：用於大規模圖

2025/08/02

AI說書 - 從0開始 - 486 | Vision Transformer 介紹

#AI 的其他內容

記憶體外，下一個供不應求行業，能見度看到2028

學習玩家｜啟動玩心學習

NotebookLM 視覺敘事再升級：資訊圖表與簡報製作登場

普普文創

【踏青漫步】剪刀石山 258公尺

你可能也想看

Chloe小窩

香調註記｜水中閉氣・仰望天空｜Sunkronizo 同步靈魂

這篇文章記錄了我與香氛品牌 Sunkronizo 的相遇，用氣味重新校準生活的節奏。從前調的水底靜謐，到中調的貼膚潔淨，再到基調的安穩木質，每一層都像在提醒自己：慢下來、呼吸、同步。 Silent Wild 對我來說，是一種存在方式的註記，也是我日常裡的小小儀式。

#香水#香水評論#試香

2025/11/27

Chloe小窩

香調註記｜水中閉氣・仰望天空｜Sunkronizo 同步靈魂

#香水#香水評論#試香

2025/11/27

Learn AI 不 BI

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 129 中說，Bidirectional Encoder Representations from Transformers (BER

#AI#ai#PromptEngineering

2024/08/13

Learn AI 不 BI

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

#AI#ai#PromptEngineering

2024/08/13

Learn AI 不 BI

AI說書 - 從0開始 - 128 | Transformer 和 BERT 模型參數比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 127 中提及： Transformer 的關鍵參數為：原始 Transformer 模型中，左圖的 N = 6 原始 Tran

#AI#ai#PromptEngineering

2024/08/12

Learn AI 不 BI

AI說書 - 從0開始 - 128 | Transformer 和 BERT 模型參數比較

#AI#ai#PromptEngineering

2024/08/12

Learn AI 不 BI

AI說書 - 從0開始 - 82

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 可以透過繼承預訓練模型 (Pretrained Model) 來微調 (Fine-Tune) 以執行下游任務。 Pretrained Mo

#AI#ai#PromptEngineering

2024/07/10

Learn AI 不 BI

AI說書 - 從0開始 - 82

#AI#ai#PromptEngineering

2024/07/10

Learn AI 不 BI

AI說書 - 從0開始 - 67

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformers for Natural Language Processing and Computer Vision, 2024 這本書中講 Decoder

#AI#ai#PromptEngineering

2024/06/30

Learn AI 不 BI

AI說書 - 從0開始 - 67

#AI#ai#PromptEngineering

2024/06/30

Learn AI 不 BI

AI說書 - 從0開始 - 52

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformers for Natural Language Processing and Computer Vision, 2024 這本書中講 Attenti

#AI#ai#PromptEngineering

2024/06/26

Learn AI 不 BI

AI說書 - 從0開始 - 52

#AI#ai#PromptEngineering

2024/06/26

Learn AI 不 BI

AI說書 - 從0開始 - 51

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。講完 Transformer 之 Encoder 架構中的 Embedding 與 Positional Encoding 部分，現在進入 Multi-Head Att

#AI#ai#PromptEngineering

2024/06/26

Learn AI 不 BI

AI說書 - 從0開始 - 51

#AI#ai#PromptEngineering

2024/06/26

Learn AI 不 BI

AI說書 - 從0開始 - 49

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。再度回到 Transformer 架構中的 Encoder 部分，如下圖所示：我現在手上有的素材如下： Embedding 訓練方式：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/06/25

Learn AI 不 BI

AI說書 - 從0開始 - 49

#AI#ai#PromptEngineering

2024/06/25

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News