AI說書 - 從0開始 - 51

Learn AI 不 BI

AI說書 - 從0開始 - 51

發佈於三分鐘學AI

更新於 2024/06/26發佈於 2024/06/26閱讀時間約 1 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

講完 Transformer 之 Encoder 架構中的 Embedding 與 Positional Encoding 部分，現在進入 Multi-Head Attention 部分，其架構如下：

raw-image

我們現在擁有項目為：

一段句子中，每個字各別的 Embedding
一段句子中，每個字各別的 Positional Encoding
一段句子中，每個字上述兩者的合成向量

想像一段句子：「The cat sat on the rug and it was dry-cleaned」，我想要陳述這段句子的各種關係，比方說：

「cat」與「sat」
「cat」與「rug」
「rug」與「dry-cleaned」
等等以此類推

現在想法是「上述一種關係」我就用一個 Attention 機制來進行追蹤，但是我有很多關係組怎麼辦，那就自然冒出 Multi-Head Attention 這個機制了，而且我們之前說一個 Attention 模組的運算是矩陣乘積的組合，那我現在有 Multi-Head Attention，就可以好好利用 GPU 的平行運算機制了。

#PromptEngineering

#PositionalEncoding

Learn AI 不 BI三分鐘學AIAI從0開始-第二章

Learn AI 不 BI

218會員

574內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言

留言分享你的想法！

Learn AI 不 BI 的其他內容

AI說書 - 從0開始 - 71

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 37 到 AI說書 - 從0開始 - 70 ，我們完成書籍：Transformers for Natural Language Proc

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 70

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 的重要性已經被公認了，因此在 Hugging Face 中亦有被實作，呼叫方式如下： !pip -q install transformers

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 69

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformers for Natural Language Processing and Computer Vision, 2024 這本書中講 Trainin

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 71

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 37 到 AI說書 - 從0開始 - 70 ，我們完成書籍：Transformers for Natural Language Proc

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 70

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 的重要性已經被公認了，因此在 Hugging Face 中亦有被實作，呼叫方式如下： !pip -q install transformers

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 69

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformers for Natural Language Processing and Computer Vision, 2024 這本書中講 Trainin

#AI #ai #PromptEngineering