Learn AI 不 BI

AI說書 - 從0開始 - 254 | Attention Head 輸出機率檢視

發佈於三分鐘學AI (2)

更新於 2024/11/21發佈於 2024/11/21閱讀時間約 3 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

為了檢視 Attention Head 輸出機率，我們撰寫以下程式：

!pip install transformers
from transformers import BertTokenizer, BertModel

input_text = "The output shows the attention values" #@param {type:"string"}

from transformers import BertTokenizer, BertModel

model_name = 'bert-base-uncased'
tokenizer = BertTokenizer.from_pretrained(model_name)
model = BertModel.from_pretrained(model_name, output_attentions = True)
tokens = tokenizer.tokenize(input_text)
input_ids = tokenizer.convert_tokens_to_ids(tokens)

inputs = tokenizer.encode_plus(input_text, return_tensors = 'pt')
input_ids = inputs['input_ids']
attention_mask = inputs['attention_mask']
outputs = model(input_ids, attention_mask = attention_mask)
attentions = outputs.attentions

當中註解如下：

input_text：這是一個字串變數 (input_text)，它被賦值為 The output shows the attention values，這段文字表示變數內的內容
#@param {type:"string"}：這是 Colab Notebooks 中用來指定變數類型的註釋，在 Google Colab 中使用 #@param 可以讓此變數在筆記本的 UI 界面中顯示為可編輯的字段，{type:"string"} 指定了這個參數應該是一個字符串

#PromptEngineering

#chatgpt怎麼用

Learn AI 不 BI三分鐘學AI (2)AI從0開始-第九章

Learn AI 不 BI

182會員

487內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言0

查看全部

發表第一個留言支持創作者！

Learn AI 不 BI 的其他內容

AI說書 - 從0開始 - 253 | Attention 模型視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。如果我們想要獲得 Transformer 的模型觀點，只需要撰寫以下程式碼： model_view(attention, tokens, sentence_b_sta

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 252 | Attention Head 視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 251 | Attention Head 視覺化對 BertViz 的操作，如果我們點選「cats」一詞，會得到以下結果圖：其

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 251 | Attention Head 視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 250 | Attention Head 視覺化的內容，接著開始分析，兩列標記上方的每種顏色代表 Layer Number 的一個注

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 250 | Attention Head 視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 249 | BertViz 安裝中已經準備好所有的素材了，包含 BertViz 的安裝，以及資料準備，現在可以展開視覺化之旅：

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 249 | BertViz 安裝

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Jesse Vig 的文章 A Multiscale Visualization of Attention in the Transformer Model, 2019

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 248 | 第九章總覽

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在本章結束時，您將能夠與使用者互動以顯示 Transformer 模型活動的視覺化，Transformer 的解譯工具還有很長的路要走，然而，這些新興工具將幫助開發人員

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 253 | Attention 模型視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。如果我們想要獲得 Transformer 的模型觀點，只需要撰寫以下程式碼： model_view(attention, tokens, sentence_b_sta

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 252 | Attention Head 視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 251 | Attention Head 視覺化對 BertViz 的操作，如果我們點選「cats」一詞，會得到以下結果圖：其

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 251 | Attention Head 視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 250 | Attention Head 視覺化的內容，接著開始分析，兩列標記上方的每種顏色代表 Layer Number 的一個注

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 250 | Attention Head 視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 249 | BertViz 安裝中已經準備好所有的素材了，包含 BertViz 的安裝，以及資料準備，現在可以展開視覺化之旅：

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 249 | BertViz 安裝

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Jesse Vig 的文章 A Multiscale Visualization of Attention in the Transformer Model, 2019

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 248 | 第九章總覽

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在本章結束時，您將能夠與使用者互動以顯示 Transformer 模型活動的視覺化，Transformer 的解譯工具還有很長的路要走，然而，這些新興工具將幫助開發人員

#AI #ai #PromptEngineering

你可能也想看

Google News 追蹤

閒水鴨的沙龍

連媽媽都會用！輕鬆養成專屬自己的質感金融生活圈

/ 大家現在出門買東西還會帶錢包嗎鴨鴨發現自己好像快一個禮拜沒帶錢包出門還是可以天天買滿買好回家(? 因此為了記錄手機消費跟各種紅利優惠鴨鴨都會特別注意銀行的App好不好用！像是介面設計就是會很在意的地方很多銀行通常會為了要滿足不同客群會推出很多App讓使用者下載每次

#國泰世華銀行 #國泰世華 #國泰世華CUBEApp

Learn AI 不 BI

AI說書 - 從0開始 - 62

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 61

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 58

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 57

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 56

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 55

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 54

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 53

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 52 中，我們已經解析完 Attention 機制如何運作的，以下延伸至 Multi-Head Attention： Head 1

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 52

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformers for Natural Language Processing and Computer Vision, 2024 這本書中講 Attenti

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 38

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。既然要談論 Transformer 的 Attention 機制，我們必須要談論以下主題： Transformer 架構自注意力機制編碼與解碼 Embedd

#AI #ai #PromptEngineering

閒水鴨的沙龍

連媽媽都會用！輕鬆養成專屬自己的質感金融生活圈

/ 大家現在出門買東西還會帶錢包嗎鴨鴨發現自己好像快一個禮拜沒帶錢包出門還是可以天天買滿買好回家(? 因此為了記錄手機消費跟各種紅利優惠鴨鴨都會特別注意銀行的App好不好用！像是介面設計就是會很在意的地方很多銀行通常會為了要滿足不同客群會推出很多App讓使用者下載每次

#國泰世華銀行 #國泰世華 #國泰世華CUBEApp

Learn AI 不 BI

AI說書 - 從0開始 - 62

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 61

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 58

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 57

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 56

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 55

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 54

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 53

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 52 中，我們已經解析完 Attention 機制如何運作的，以下延伸至 Multi-Head Attention： Head 1

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 52

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformers for Natural Language Processing and Computer Vision, 2024 這本書中講 Attenti

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 38

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。既然要談論 Transformer 的 Attention 機制，我們必須要談論以下主題： Transformer 架構自注意力機制編碼與解碼 Embedd

#AI #ai #PromptEngineering