AI說書 - 從0開始 - 255 | Attention Head 輸出機率檢視

發佈於三分鐘學AI (2)

2024/11/23 更新2024/11/23 發佈閱讀 2 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

有了 AI說書 - 從0開始 - 254 | Attention Head 輸出機率檢視的準備，我們可以撰寫以下程式來檢視 Attention Head 的輸出機率：

for layer, attention in enumerate(attentions):
	print(f"Layer {layer+1}:")
	for head, head_attention in enumerate(attention[0]):
		print(f"Head {head+1}:")
		for source_token, target_tokens in enumerate(head_attention[:len(tokens)]):
			print(f"Source token '{tokens[source_token]}' (index {source_token+1}):")
			for target_token, attention_value in enumerate(target_tokens[:len(tokens)]):
				print(f"Target token '{tokens[target_token]}' (index {target_token+1}): {attention_value}")

結果為：

raw-image

#PromptEngineering

#chatgpt怎麼用

Learn AI 不 BI三分鐘學AI (2)AI從0開始-第九章

留言

留言分享你的想法！

Learn AI 不 BI

246會員

997內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2024/12/28

AI說書 - 從0開始 - 279 | 第九章額外閱讀

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 247 | 第九章引言到 AI說書 - 從0開始 - 278 | 模型視覺化極限與人為介入，我們完成書籍：Transformers f

2024/12/28

AI說書 - 從0開始 - 279 | 第九章額外閱讀

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 247 | 第九章引言到 AI說書 - 從0開始 - 278 | 模型視覺化極限與人為介入，我們完成書籍：Transformers f

2024/12/27

AI說書 - 從0開始 - 278 | 模型視覺化極限與人為介入

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 模型的解釋已經取得了進展，但仍有許多工作要做，有些絆腳石仍然相當具有挑戰性： Embedding Sublayer 基於隨機計算，並添加到複雜

2024/12/27

AI說書 - 從0開始 - 278 | 模型視覺化極限與人為介入

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 模型的解釋已經取得了進展，但仍有許多工作要做，有些絆腳石仍然相當具有挑戰性： Embedding Sublayer 基於隨機計算，並添加到複雜

2024/12/26

AI說書 - 從0開始 - 277 | OpenAI Transformer 模型之視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化及 AI說書 - 從0開始 - 276 | OpenAI Transf

2024/12/26

AI說書 - 從0開始 - 277 | OpenAI Transformer 模型之視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化及 AI說書 - 從0開始 - 276 | OpenAI Transf

你可能也想看

Learn AI 不 BI

AI說書 - 從0開始 - 320 | Embedding 後詞彙相似度計算

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧目前手上有的素材：載入文本並執行 Tokenization：AI說書 - 從0開始 - 314 | 載入文本並執行 Tokenization 文本處理以降低

#AI#ai#PromptEngineering

2025/02/09

Learn AI 不 BI

AI說書 - 從0開始 - 320 | Embedding 後詞彙相似度計算

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧目前手上有的素材：載入文本並執行 Tokenization：AI說書 - 從0開始 - 314 | 載入文本並執行 Tokenization 文本處理以降低

#AI#ai#PromptEngineering

2025/02/09

Learn AI 不 BI

AI說書 - 從0開始 - 319 | 檢視 Embedding 是否包含某詞彙

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧目前手上有的素材：載入文本並執行 Tokenization：AI說書 - 從0開始 - 314 | 載入文本並執行 Tokenization 文本處理以降低

#AI#ai#PromptEngineering

2025/02/08

Learn AI 不 BI

AI說書 - 從0開始 - 319 | 檢視 Embedding 是否包含某詞彙

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧目前手上有的素材：載入文本並執行 Tokenization：AI說書 - 從0開始 - 314 | 載入文本並執行 Tokenization 文本處理以降低

#AI#ai#PromptEngineering

2025/02/08

Learn AI 不 BI

AI說書 - 從0開始 - 298 | 各 Tokenizer 之展示

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 295 | 各 Tokenizer 之優勢與安裝、AI說書 - 從0開始 - 296 | 各 Tokenizer 之展示、AI說書 -

#AI#ai#PromptEngineering

2025/01/17

Learn AI 不 BI

AI說書 - 從0開始 - 298 | 各 Tokenizer 之展示

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 295 | 各 Tokenizer 之優勢與安裝、AI說書 - 從0開始 - 296 | 各 Tokenizer 之展示、AI說書 -

#AI#ai#PromptEngineering

2025/01/17

Learn AI 不 BI

AI說書 - 從0開始 - 259 | Attention Head 輸出機率檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 257 | Attention Head 輸出機率檢視中，撰寫了程式，試圖視覺化 Attention Head 輸出機率，以下開始

#AI#ai#PromptEngineering

2024/12/02

Learn AI 不 BI

AI說書 - 從0開始 - 259 | Attention Head 輸出機率檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 257 | Attention Head 輸出機率檢視中，撰寫了程式，試圖視覺化 Attention Head 輸出機率，以下開始

#AI#ai#PromptEngineering

2024/12/02

Learn AI 不 BI

AI說書 - 從0開始 - 258 | Attention Head 輸出機率檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 257 | Attention Head 輸出機率檢視中，撰寫了程式，試圖視覺化 Attention Head 輸出機率，以下開始

#AI#ai#PromptEngineering

2024/11/30

Learn AI 不 BI

AI說書 - 從0開始 - 258 | Attention Head 輸出機率檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 257 | Attention Head 輸出機率檢視中，撰寫了程式，試圖視覺化 Attention Head 輸出機率，以下開始

#AI#ai#PromptEngineering

2024/11/30

Learn AI 不 BI

AI說書 - 從0開始 - 256 | Attention Head 輸出機率檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧我們在 AI說書 - 從0開始 - 255 | Attention Head 輸出機率檢視中，檢視 Attention Head 的輸出機率，這以數學層面來說就是

#AI#ai#PromptEngineering

2024/11/26

Learn AI 不 BI

AI說書 - 從0開始 - 256 | Attention Head 輸出機率檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧我們在 AI說書 - 從0開始 - 255 | Attention Head 輸出機率檢視中，檢視 Attention Head 的輸出機率，這以數學層面來說就是

#AI#ai#PromptEngineering

2024/11/26

Learn AI 不 BI

AI說書 - 從0開始 - 255 | Attention Head 輸出機率檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。有了 AI說書 - 從0開始 - 254 | Attention Head 輸出機率檢視的準備，我們可以撰寫以下程式來檢視 Attention Head 的輸出機率：

#AI#ai#PromptEngineering

2024/11/23

Learn AI 不 BI

AI說書 - 從0開始 - 255 | Attention Head 輸出機率檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。有了 AI說書 - 從0開始 - 254 | Attention Head 輸出機率檢視的準備，我們可以撰寫以下程式來檢視 Attention Head 的輸出機率：

#AI#ai#PromptEngineering

2024/11/23

Learn AI 不 BI

AI說書 - 從0開始 - 253 | Attention 模型視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。如果我們想要獲得 Transformer 的模型觀點，只需要撰寫以下程式碼： model_view(attention, tokens, sentence_b_sta

#AI#ai#PromptEngineering

2024/11/18

Learn AI 不 BI

AI說書 - 從0開始 - 253 | Attention 模型視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。如果我們想要獲得 Transformer 的模型觀點，只需要撰寫以下程式碼： model_view(attention, tokens, sentence_b_sta

#AI#ai#PromptEngineering

2024/11/18

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News