AI說書 - 從0開始 - 257 | Attention Head 輸出機率檢視

Learn AI 不 BI

AI說書 - 從0開始 - 257 | Attention Head 輸出機率檢視

發佈於三分鐘學AI (2)

更新於 2024/11/28發佈於 2024/11/28閱讀時間約 4 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

現在我們想要檢視 Attention Head 係數，且以 Word x Word 的方式呈現，以下開始程式撰寫：

import pandas as pd 
import ipywidgets as widgets

df_layers_heads = []
for layer, attention in enumerate(attentions):
	for head, head_attention in enumerate(attention[0]):
		attention_matrix = head_attention[:len(tokens), :len(tokens)].detach().numpy()
		df_attention = pd.DataFrame(attention_matrix, index = tokens, columns = tokens)
		df_layers_heads.append((layer, head, df_attention))
		
		
pd.set_option('display.max_columns', None)
pd.set_option('display.expand_frame_repr', False)
pd.set_option('max_colwidth', None)


# Function to display the attention matrix
def display_attention(selected_layer, selected_head):
	_, _, df_to_display = next(df for df in df_layers_heads if df[0] == selected_layer and df[1] == selected_head)
	display(df_to_display)
	
	
# Create interactive widgets for the layer and head
layer_widget = widgets.IntSlider(min = 0, max = len(attentions)-1, step = 1, description = 'Layer:')
head_widget = widgets.IntSlider(min = 0, max = len(attentions[0][0])-1, step = 1, description = 'Head:')


widgets.interact(display_attention, selected_layer = layer_widget, selected_head = head_widget)

#PromptEngineering

#chatgpt怎麼用

Learn AI 不 BI三分鐘學AI (2)AI從0開始-第九章

Learn AI 不 BI

218會員

562內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言

留言分享你的想法！

Learn AI 不 BI 的其他內容

AI說書 - 從0開始 - 256 | Attention Head 輸出機率檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧我們在 AI說書 - 從0開始 - 255 | Attention Head 輸出機率檢視中，檢視 Attention Head 的輸出機率，這以數學層面來說就是

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 255 | Attention Head 輸出機率檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。有了 AI說書 - 從0開始 - 254 | Attention Head 輸出機率檢視的準備，我們可以撰寫以下程式來檢視 Attention Head 的輸出機率：

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 254 | Attention Head 輸出機率檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。為了檢視 Attention Head 輸出機率，我們撰寫以下程式： !pip install transformers from transformers impo

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 253 | Attention 模型視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。如果我們想要獲得 Transformer 的模型觀點，只需要撰寫以下程式碼： model_view(attention, tokens, sentence_b_sta

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 252 | Attention Head 視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 251 | Attention Head 視覺化對 BertViz 的操作，如果我們點選「cats」一詞，會得到以下結果圖：其

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 251 | Attention Head 視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 250 | Attention Head 視覺化的內容，接著開始分析，兩列標記上方的每種顏色代表 Layer Number 的一個注

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 256 | Attention Head 輸出機率檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧我們在 AI說書 - 從0開始 - 255 | Attention Head 輸出機率檢視中，檢視 Attention Head 的輸出機率，這以數學層面來說就是

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 255 | Attention Head 輸出機率檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。有了 AI說書 - 從0開始 - 254 | Attention Head 輸出機率檢視的準備，我們可以撰寫以下程式來檢視 Attention Head 的輸出機率：

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 254 | Attention Head 輸出機率檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。為了檢視 Attention Head 輸出機率，我們撰寫以下程式： !pip install transformers from transformers impo

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 253 | Attention 模型視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。如果我們想要獲得 Transformer 的模型觀點，只需要撰寫以下程式碼： model_view(attention, tokens, sentence_b_sta

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 252 | Attention Head 視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 251 | Attention Head 視覺化對 BertViz 的操作，如果我們點選「cats」一詞，會得到以下結果圖：其

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 251 | Attention Head 視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 250 | Attention Head 視覺化的內容，接著開始分析，兩列標記上方的每種顏色代表 Layer Number 的一個注

#AI #ai #PromptEngineering