ViT

含有「ViT」共 13 篇內容

全部內容

發佈日期由新至舊

2025/08/15

AI說書 - 從0開始 - 497 | Vision Transformer 之輸出 Softmax 檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們可以對輸出的 Logit 應用 Temperature、Softmax、Top-K 與 Top-P，以下為應用 Softmax： probs = torch.nn

#AI #ai #PromptEngineering

Vytha xu

2025/08/16

❤️ ❤️ ❤️ ❤️

Learn AI 不 BI

2025/08/14

AI說書 - 從0開始 - 496 | Vision Transformer 之輸出標籤檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們可以窺探 ViT 模型的輸出標籤形狀： print(outputs.logits.shape) 結果為：也可以看看模型原本配置幾個標籤： mode

#AI #ai #PromptEngineering

Learn AI 不 BI

2025/08/13

AI說書 - 從0開始 - 495 | Vision Transformer 之模型參數檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。以下程式碼顯示 ViT 模型： model 結果為：

#AI #ai #PromptEngineering

Learn AI 不 BI

2025/08/12

AI說書 - 從0開始 - 494 | Vision Transformer 之特徵提取器之參數檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。以下程式碼顯示了特徵提取器的配置，輸出顯示了特徵提取器的配置：您可以看到特徵提取器如何處理 224 x 224 的影像，包括正規化、重新縮放、調整大小、計算均值

#AI #ai #PromptEngineering

Learn AI 不 BI

2025/08/11

AI說書 - 從0開始 - 493 | Vision Transformer 程式實作

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。預處理後的圖像接著被輸入到 ViT 模型（ViTForImageClassification）中，該模型會輸出 Logits，Logits 是模型最終層對分類任務中每個

#AI #ai #PromptEngineering

Learn AI 不 BI

2025/08/10

AI說書 - 從0開始 - 492 | Vision Transformer 特徵提取器之呼叫方式

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。特徵提取器是模型 Pipeline 的重要組件，它對原始輸入數據（此處為圖像）進行必要的預處理，將其轉換為適合輸入模型的格式，我們來總結一下 ViT 特徵提取器的功能：

#AI #ai #PromptEngineering

Learn AI 不 BI

2025/08/08

AI說書 - 從0開始 - 491 | Vision Transformer 特徵提取器效果檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 patches_reshaped = patches.permute(0, 2, 3, 1, 4, 5).contiguous().view(-1, 3, patch_si

#AI #ai #PromptEngineering

Learn AI 不 BI

2025/08/07

AI說書 - 從0開始 - 490 | Vision Transformer 特徵提取器實作

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在原始的 ViT 論文中，這些區塊在被線性嵌入到適合 Transformer 的維度後，會直接輸入到 Transformer 模型中，亦即，這些區塊就是 Transfo

#AI #ai #PromptEngineering

Learn AI 不 BI

2025/08/06

AI說書 - 從0開始 - 489 | Vision Transformer 特徵提取器核心理念說明

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們將建立一個特徵提取器模擬器，以說明圖像如何被分割為區塊並成為 Transformer 的輸入，Vision Transformer（ViT）模型將原始輸入圖像分割成

#AI #ai #PromptEngineering

Learn AI 不 BI

2025/08/05

AI說書 - 從0開始 - 488 | Vision Transformer 輸入資料之圖片檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。為了解釋 ViT 模型，首先先下載圖片，方便後續使用： from IPython.display import Image !curl -L https://raw.

#AI #ai #PromptEngineering

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌