AI說書 - 從0開始 - 279 | 第九章額外閱讀

發佈於三分鐘學AI (2)

更新於 2024/12/28發佈於 2024/12/28閱讀時間約 4 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

從 AI說書 - 從0開始 - 247 | 第九章引言到 AI說書 - 從0開始 - 278 | 模型視覺化極限與人為介入，我們完成書籍：Transformers for Natural Language Processing and Computer Vision, Denis Rothman, 2024 第九章說明。

以下附上參考項目：

BertViz: https://github.com/jessevig/BertViz
Zeyu Yun, Yubei Chen, Bruno A. Olshausen, Yann LeCun, 2021, Transformer visualization via dictio- nary learning: contextualized embedding as a linear superposition of transformer factors: https:// arxiv.org/abs/2103.15949
Hugging Face with Slunberg SHAP: https://github.com/slundberg/SHAPTransformer
Visualization via dictionary learning: https://transformervis.github.io/transformervis/
OpenAI, Large Language Models can explain neurons in language models: https://openai.com/ research/language-models-can-explain-neurons-in-language-models
OpenAI neuro explainer paper: https://openaipublic.blob.core.windows.net/neuron- explainer/paper/index.html
LIT: https://pair-code.github.io/lit/

以下附上額外閱讀項目：

Hoover et al., 2021, exBERT: A Visual Analysis Tool to Explore Learned Representations in Transformers Models: https://arxiv.org/abs/1910.05276
Jesse Vig, 2019, A Multiscale Visualization of Attention in the Transformer Model: https:// aclanthology.org/P19-3007.pdf

#PromptEngineering

#chatgpt怎麼用

Learn AI 不 BI三分鐘學AI (2)AI從0開始-第九章

留言

留言分享你的想法！

2024/12/29

假期愉快

Learn AI 不 BI

232會員

705內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2024/12/27

AI說書 - 從0開始 - 278 | 模型視覺化極限與人為介入

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 模型的解釋已經取得了進展，但仍有許多工作要做，有些絆腳石仍然相當具有挑戰性： Embedding Sublayer 基於隨機計算，並添加到複雜

2024/12/27

AI說書 - 從0開始 - 278 | 模型視覺化極限與人為介入

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 模型的解釋已經取得了進展，但仍有許多工作要做，有些絆腳石仍然相當具有挑戰性： Embedding Sublayer 基於隨機計算，並添加到複雜

2024/12/26

AI說書 - 從0開始 - 277 | OpenAI Transformer 模型之視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化及 AI說書 - 從0開始 - 276 | OpenAI Transf

2024/12/26

AI說書 - 從0開始 - 277 | OpenAI Transformer 模型之視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化及 AI說書 - 從0開始 - 276 | OpenAI Transf

2024/12/25

AI說書 - 從0開始 - 276 | OpenAI Transformer 模型之視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化的操作，以下繼續：我們可以提出一個更好的解釋，並要求查看得分細節，這些

2024/12/25

AI說書 - 從0開始 - 276 | OpenAI Transformer 模型之視覺化

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化的操作，以下繼續：我們可以提出一個更好的解釋，並要求查看得分細節，這些