AI說書 - 從0開始 - 491 | Vision Transformer 特徵提取器效果檢視

發佈於三分鐘學AI (3)

2025/08/08 更新2025/08/08 發佈閱讀 3 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

我們撰寫一個程式，來看看轉換後的圖形長什麼樣子：

patches_reshaped = patches.permute(0, 2, 3, 1, 4, 5).contiguous().view(-1, 3, patch_size, patch_size)

to_pil = transforms.ToPILImage() # create a transform to convert tensor to PIL Image

for i in range(patches_reshaped.size(0)):
	print(f"Displaying patch {i+1}/{patches_reshaped.size(0)}")
	patch_size = patches_reshaped[i].shape
	plt.title(f"Patch {i+1}, size: {patch_size}")
	plt.imshow(to_pil(patches_reshaped[i]))
	plt.axis("off")
	plt.show()

當中程式碼解說為：

patches 形狀為 (batch_size, channels, num_patches_height, num_patches_width, patch_size, patch_size)
permute(0, 2, 3, 1, 4, 5) 的操作順序將維度重新排列為 (batch_size, num_patches_height, num_patches_width, channels, patch_size, patch_size)
.contiguous() 函數確保 Tensor 在記憶體中的排列是連續的，這在後續進行 .view() 操作時尤為重要，因為 PyTorch 需要 Tensor 的數據是連續的才能進行有效的重塑操作
.view(-1, 3, patch_size, patch_size) 將 Tensor 變成一個四維張量，形狀為 (batch_size * num_patches_height * num_patches_width, channels, patch_size, patch_size)

結果將有 196 張 16 x 16 的圖片，舉例一張為：

raw-image

#PromptEngineering

#chatgpt怎麼用

Learn AI 不 BI三分鐘學AI (3)AI從0開始-十六章

留言

留言分享你的想法！

Learn AI 不 BI

241會員

929內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2025/08/07

AI說書 - 從0開始 - 490 | Vision Transformer 特徵提取器實作

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在原始的 ViT 論文中，這些區塊在被線性嵌入到適合 Transformer 的維度後，會直接輸入到 Transformer 模型中，亦即，這些區塊就是 Transfo

2025/08/07

AI說書 - 從0開始 - 490 | Vision Transformer 特徵提取器實作

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在原始的 ViT 論文中，這些區塊在被線性嵌入到適合 Transformer 的維度後，會直接輸入到 Transformer 模型中，亦即，這些區塊就是 Transfo

2025/08/06

AI說書 - 從0開始 - 489 | Vision Transformer 特徵提取器核心理念說明

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們將建立一個特徵提取器模擬器，以說明圖像如何被分割為區塊並成為 Transformer 的輸入，Vision Transformer（ViT）模型將原始輸入圖像分割成

2025/08/06

AI說書 - 從0開始 - 489 | Vision Transformer 特徵提取器核心理念說明

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們將建立一個特徵提取器模擬器，以說明圖像如何被分割為區塊並成為 Transformer 的輸入，Vision Transformer（ViT）模型將原始輸入圖像分割成

2025/08/05

AI說書 - 從0開始 - 488 | Vision Transformer 輸入資料之圖片檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。為了解釋 ViT 模型，首先先下載圖片，方便後續使用： from IPython.display import Image !curl -L https://raw.

2025/08/05

AI說書 - 從0開始 - 488 | Vision Transformer 輸入資料之圖片檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。為了解釋 ViT 模型，首先先下載圖片，方便後續使用： from IPython.display import Image !curl -L https://raw.

#AI 的其他內容

出鞘的雙面刃：AI

目前共 14362 篇

【踏青漫步】剪刀石山 258公尺

林位青的沙龍

Google Stitch：生成 UI 介面設計，加速產品原型開發與協作

Gemini Pro 學生方案怎麼一直申請失敗? 原來是少做了「這件事」!

你可能也想看

夢夢 🍰 甜點魔法

🎁 夢夢的蝦皮分潤開箱日記｜雙11購物攻略＆好物清單分享♡

嗨～我是夢夢 ♡ 每年到這個時候，我都會默默開始列購物清單畢竟「蝦皮雙11」真的太好買啦 🛒✨ 這次就想跟大家分享幾樣我自己平常有在用、也準備趁雙11補貨的好物，順便聊聊我最近開始玩的「蝦皮分潤計畫」，怎麼讓分享變成小小被動收入 💰

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

夢夢 🍰 甜點魔法

🎁 夢夢的蝦皮分潤開箱日記｜雙11購物攻略＆好物清單分享♡

嗨～我是夢夢 ♡ 每年到這個時候，我都會默默開始列購物清單畢竟「蝦皮雙11」真的太好買啦 🛒✨ 這次就想跟大家分享幾樣我自己平常有在用、也準備趁雙11補貨的好物，順便聊聊我最近開始玩的「蝦皮分潤計畫」，怎麼讓分享變成小小被動收入 💰

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

騎著羊駝的摩托羅拉的沙龍

蝦皮分潤計畫-照顧多芬的神隊友

分享如何透過蝦皮解決毛孩（多芬）因換季和食物引發的皮膚過敏問題，從選用單一蛋白質的火雞肉主食，到利用寵物防舔衣舒緩傷口，並結合蝦皮雙11購物節的優惠資訊與蝦皮分潤計畫的實用教學。

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/06

騎著羊駝的摩托羅拉的沙龍

蝦皮分潤計畫-照顧多芬的神隊友

分享如何透過蝦皮解決毛孩（多芬）因換季和食物引發的皮膚過敏問題，從選用單一蛋白質的火雞肉主食，到利用寵物防舔衣舒緩傷口，並結合蝦皮雙11購物節的優惠資訊與蝦皮分潤計畫的實用教學。

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/06

Learn AI 不 BI

AI說書 - 從0開始 - 82

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 可以透過繼承預訓練模型 (Pretrained Model) 來微調 (Fine-Tune) 以執行下游任務。 Pretrained Mo

#AI#ai#PromptEngineering

2024/07/10

Learn AI 不 BI

AI說書 - 從0開始 - 82

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 可以透過繼承預訓練模型 (Pretrained Model) 來微調 (Fine-Tune) 以執行下游任務。 Pretrained Mo

#AI#ai#PromptEngineering

2024/07/10

Learn AI 不 BI

AI說書 - 從0開始 - 66

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先做個總回顧： Transformer 架構總覽：AI說書 - 從0開始 - 39 Attention 意圖說明：AI說書 - 從0開始 - 40 Transfo

#AI#ai#PositionalEncoding

2024/06/29

Learn AI 不 BI

AI說書 - 從0開始 - 66

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先做個總回顧： Transformer 架構總覽：AI說書 - 從0開始 - 39 Attention 意圖說明：AI說書 - 從0開始 - 40 Transfo

#AI#ai#PositionalEncoding

2024/06/29

Learn AI 不 BI

AI說書 - 從0開始 - 59

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI#ai#PromptEngineering

2024/06/28

Learn AI 不 BI

AI說書 - 從0開始 - 59

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI#ai#PromptEngineering

2024/06/28

Learn AI 不 BI

AI說書 - 從0開始 - 58

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI#ai#PromptEngineering

2024/06/27

Learn AI 不 BI

AI說書 - 從0開始 - 58

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI#ai#PromptEngineering

2024/06/27

Learn AI 不 BI

AI說書 - 從0開始 - 56

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI#ai#PromptEngineering

2024/06/27

Learn AI 不 BI

AI說書 - 從0開始 - 56

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI#ai#PromptEngineering

2024/06/27

Learn AI 不 BI

AI說書 - 從0開始 - 55

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI#ai#PromptEngineering

2024/06/27

Learn AI 不 BI

AI說書 - 從0開始 - 55

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI#ai#PromptEngineering

2024/06/27

Learn AI 不 BI

AI說書 - 從0開始 - 52

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformers for Natural Language Processing and Computer Vision, 2024 這本書中講 Attenti

#AI#ai#PromptEngineering

2024/06/26

Learn AI 不 BI

AI說書 - 從0開始 - 52

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformers for Natural Language Processing and Computer Vision, 2024 這本書中講 Attenti

#AI#ai#PromptEngineering

2024/06/26

Learn AI 不 BI

AI說書 - 從0開始 - 49

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。再度回到 Transformer 架構中的 Encoder 部分，如下圖所示：我現在手上有的素材如下： Embedding 訓練方式：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/06/25

Learn AI 不 BI

AI說書 - 從0開始 - 49

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。再度回到 Transformer 架構中的 Encoder 部分，如下圖所示：我現在手上有的素材如下： Embedding 訓練方式：AI說書 - 從0開始

#AI#ai#PromptEngineering

2024/06/25

Learn AI 不 BI

AI說書 - 從0開始 - 47

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧我們在AI說書 - 從0開始 - 41中，提及 Transformer 的 Encoder 架構如下圖所示：此外我已經在AI說書 - 從0開始 - 42中，

#AI#ai#PromptEngineering

2024/06/25

Learn AI 不 BI

AI說書 - 從0開始 - 47

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧我們在AI說書 - 從0開始 - 41中，提及 Transformer 的 Encoder 架構如下圖所示：此外我已經在AI說書 - 從0開始 - 42中，

#AI#ai#PromptEngineering

2024/06/25

Learn AI 不 BI

AI說書 - 從0開始 - 42

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在AI說書 - 從0開始 - 41中，我們提及 Transformer 的 Encoder 架構如下圖所示，同時我們羅列幾個要點於圖示右邊：原始 Transform

#AI#ai#PromptEngineering

2024/06/23

Learn AI 不 BI

AI說書 - 從0開始 - 42

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在AI說書 - 從0開始 - 41中，我們提及 Transformer 的 Encoder 架構如下圖所示，同時我們羅列幾個要點於圖示右邊：原始 Transform

#AI#ai#PromptEngineering

2024/06/23

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News