AI說書 - 從0開始 - 271 | 其他解釋 Transformer 模型之方法簡介

更新於 發佈於 閱讀時間約 3 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。


  • LIT
  1. LIT 的視覺介面將幫助您找到模型處理錯誤的示例,分析類似的示例,觀察當您改變上下文時模型的行為,以及其他與 Transformer 模型相關的語言問題
  2. LIT 不會像 BertViz 那樣顯示注意力頭的活動,然而,分析出錯的原因並嘗試找到解決方案是值得的
  3. 您可以選擇使用 Uniform Manifold Approximation and Projection (UMAP) 可視化或主成分分析 (PCA) 投影表示,PCA 會在特定方向和幅度上進行更線性的投影,而 UMAP 則會將其投影分解成小簇,這兩種方法的選擇取決於您在分析模型輸出時希望深入到何種程度,您可以同時運行這兩種方法,從而獲得對同一模型和示例的不同視角
  • PCA
  1. 想像一下你在廚房裡,你的廚房是一個三維的笛卡爾坐標系,廚房裡的物體也都有特定的 x、y、z 坐標,你想要烹飪一個食譜,並在廚房的桌子上收集食材,你的廚房桌子是該食譜在廚房中的高層次表示,廚房桌子同樣使用笛卡爾坐標系,但是,當你提取廚房的主要特徵來在桌子上表示食譜時,你就在執行 PCA,這是因為你顯示了組成特定食譜的主要成分
  2. 同樣的表示方法可以應用於自然語言處理,例如,字典是一個詞語的列表,但是,那些具有共同意義的詞語構成了序列主成分的表示,LIT 中序列的 PCA 表示將有助於可視化 Transformer 的輸出,獲得 NLP PCA 表示的主要特徵是:

(a) 變異數:數據集中某個詞語的數值方差,例如,詞語的出現頻率及其意義的頻率

(b) 協方差:多個單字的變異數與資料集中另一個單字的變異數相關

(c) 特徵值和特徵向量:為了獲得笛卡爾系統中的表示,我們需要協方差的向量和幅度表示,特徵向量將提供向量的方向,特徵值將提供它們的幅度

(d) 匯出資料:最後一步是將行特徵向量乘以行數據,將特徵向量應用於原始資料集


留言
avatar-img
留言分享你的想法!
avatar-img
Learn AI 不 BI
236會員
773內容數
這裡將提供: AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹,一起在未來AI的世界擁抱AI技術,不BI。
Learn AI 不 BI的其他內容
2024/12/28
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 從 AI說書 - 從0開始 - 247 | 第九章引言 到 AI說書 - 從0開始 - 278 | 模型視覺化極限與人為介入,我們完成書籍:Transformers f
2024/12/28
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 從 AI說書 - 從0開始 - 247 | 第九章引言 到 AI說書 - 從0開始 - 278 | 模型視覺化極限與人為介入,我們完成書籍:Transformers f
2024/12/27
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 Transformer 模型的解釋已經取得了進展,但仍有許多工作要做,有些絆腳石仍然相當具有挑戰性: Embedding Sublayer 基於隨機計算,並添加到複雜
2024/12/27
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 Transformer 模型的解釋已經取得了進展,但仍有許多工作要做,有些絆腳石仍然相當具有挑戰性: Embedding Sublayer 基於隨機計算,並添加到複雜
2024/12/26
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化 及 AI說書 - 從0開始 - 276 | OpenAI Transf
Thumbnail
2024/12/26
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化 及 AI說書 - 從0開始 - 276 | OpenAI Transf
Thumbnail
看更多
你可能也想看
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化 及 AI說書 - 從0開始 - 276 | OpenAI Transf
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化 及 AI說書 - 從0開始 - 276 | OpenAI Transf
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化 的操作,以下繼續:我們可以提出一個更好的解釋,並要求查看得分細節,這些
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 275 | OpenAI Transformer 模型之視覺化 的操作,以下繼續:我們可以提出一個更好的解釋,並要求查看得分細節,這些
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在 AI說書 - 從0開始 - 271 | 其他解釋 Transformer 模型之方法簡介 中,提到 LIT 視覺化,今天我們來操作一次,首先造訪:https:/
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在 AI說書 - 從0開始 - 271 | 其他解釋 Transformer 模型之方法簡介 中,提到 LIT 視覺化,今天我們來操作一次,首先造訪:https:/
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在 AI說書 - 從0開始 - 271 | 其他解釋 Transformer 模型之方法簡介 中,提到 LIT 視覺化,今天我們來操作一次,首先造訪:https:/
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在 AI說書 - 從0開始 - 271 | 其他解釋 Transformer 模型之方法簡介 中,提到 LIT 視覺化,今天我們來操作一次,首先造訪:https:/
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在 AI說書 - 從0開始 - 271 | 其他解釋 Transformer 模型之方法簡介 中,提到 LIT 視覺化,今天我們來操作一次,首先造訪:https:/
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在 AI說書 - 從0開始 - 271 | 其他解釋 Transformer 模型之方法簡介 中,提到 LIT 視覺化,今天我們來操作一次,首先造訪:https:/
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 在 AI說書 - 從0開始 - 269 | 互動式 Transformer 視覺化介面 中,闡述了一項視覺化介面,其例子如下: 在 Transformer 架構中
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 在 AI說書 - 從0開始 - 269 | 互動式 Transformer 視覺化介面 中,闡述了一項視覺化介面,其例子如下: 在 Transformer 架構中
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在 AI說書 - 從0開始 - 266 | Transformer 視覺化透過 Dictionary Learning 中,介紹了 Dictionary Learn
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在 AI說書 - 從0開始 - 266 | Transformer 視覺化透過 Dictionary Learning 中,介紹了 Dictionary Learn
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在 AI說書 - 從0開始 - 266 | Transformer 視覺化透過 Dictionary Learning 中,介紹了 Dictionary Learn
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在 AI說書 - 從0開始 - 266 | Transformer 視覺化透過 Dictionary Learning 中,介紹了 Dictionary Learn
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 Yun et al. (2021) 的論文探討了 Dictionary Learning 在深度學習和自然語言處理中的應用,Dictionary Learning 是一
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 Yun et al. (2021) 的論文探討了 Dictionary Learning 在深度學習和自然語言處理中的應用,Dictionary Learning 是一
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 如果我們想要獲得 Transformer 的模型觀點,只需要撰寫以下程式碼: model_view(attention, tokens, sentence_b_sta
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 如果我們想要獲得 Transformer 的模型觀點,只需要撰寫以下程式碼: model_view(attention, tokens, sentence_b_sta
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News