AI說書 - 從0開始 - 11

LearnAI

發佈於三分鐘學AI

更新於 2024/06/11發佈於 2024/06/11閱讀時間約 1 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

回顧我們在AI說書 - 從0開始 - 6中說當Context長度是n，且每個字用d維度的向量表示時有以下結論：

Attention Layer的複雜度是O(n^2 * d)
Recurrent Layer的複雜度是O(d^2 * n)

這些資料出自於ChatGPT的關鍵技術 - Transformer的原始Google論文：Attention is All You Need, Vaswani et al. (2017)

我們在AI說書 - 從0開始 - 9，已經完成Colab Python GPU環境配置。現在目標是想要用Python來做模擬，且使用GPU當作運算資源，我們已經在AI說書 - 從0開始 - 10得出以下結論：

使用Attention Layer耗費: 2.8872秒
使用Recurrent Layer耗費: 36.3216秒

接著我們可以來計算一下百分比：

total = attention_time + recurrent_time
percentage_attention_time = round((attention_time / total) * 100, 2)

print(f"The percentage of self-attention computation in the sum of self-attention and recurrent computation is {percentage_attention_time}%")

對此，執行結果為：

Learn AI 不 BI三分鐘學AIAI從0開始-第一章

Learn AI 不 BI

180會員

478內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言0

查看全部

發表第一個留言支持創作者！

Learn AI 不 BI 的其他內容

AI說書 - 從0開始 - 10

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧我們在AI說書 - 從0開始 - 6中說當Context長度是n，且每個字用d維度的向量表示時有以下結論： Attention Layer的複雜度是O(n^2 *

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 9

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 8

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧我們在AI說書 - 從0開始 - 7，已經完成Colab Python環境配置。針對Attention Layer的程式配置為： start_time =

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 7

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧我們在AI說書 - 從0開始 - 6中說當Context長度是d，且每個字用d維度的向量表示時有以下結論： Attention Layer的複雜度是O(n^2 *

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 6

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧我們在AI說書 - 從0開始 - 5中說當Context長度是d，且每個字用d維度的向量表示時有以下結論： Attention Layer的複雜度是O(n^2 *

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 5

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧我們在AI說書 - 從0開始 - 4中說Transformer的精髓就是考慮「字與字之間的配對關係」，我們稱其為Attention Layer，再搭配我們在機器學習

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 10

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 9

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 8

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 7

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 6

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 5

#AI #ai #PromptEngineering

你可能也想看

Google News 追蹤

MIA的宇宙

2025/01/09

國泰世華CUBE App 美的生活體驗，給予你最好的情緒。

現代社會跟以前不同了，人人都有一支手機，只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行，然而如今科技快速發展之下，金融App無聲無息地進到你生活中。但同樣的，每一家銀行都有自己的App時，我們又該如何選擇呢？(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB

#國泰世華 #CUBE卡 #金融

筱涵｜Hannah的沙龍

2025/01/02

【生活記事】AI人工智慧解籤｜慈母籤｜線上求籤｜科技與玄學

嘿，大家新年快樂~ 新年大家都在做什麼呢？跨年夜的我趕工製作某個外包設計案，在工作告一段落時趕上倒數。然後和兩個小孩過了一個忙亂的元旦。在深夜時刻，看到朋友傳來的解籤網站，興致勃勃熬夜體驗了一下，覺得非常好玩，或許有人玩過了，但還是想寫上來分享紀錄一下~

#互動設計 #文化體驗 #慈母籤

曼徹的矽谷旅記 Mencher’s Travelogue

2024/08/05

ML Infra 一大戰場 - 分散式訓練

本系列將討論 LLM 時代中，分散 ML workload 的各種方法。作為系列的第一篇，我們將提及 High-level 的概論，譬如分散式訓練的各種切法、Model Parallelism 的相依問題，以及改善 Network Topology 等課題。

#討論 #ML #LLM

牧牧的沙龍

2024/07/27

超速學習，探索無限可能！

繪製個人學習藍圖，戰勝拖延與分心，並運用直接學習法，讓你的學習更加目標導向。重複練習與自由回想則能幫助你鞏固知識，根據反饋調整學習方向，確保你在正確的道路上不斷進步。立即開始，讓學習變得更高效！

#學習 #自我成長 #超速學習

柴郡貓姍蒂的沙龍

2024/06/29

筆記-深度學習參數理解："input_shape"

前言在閱讀《強化式學習：打造最強 AlphaZero 通用演算法》時，對一些看似基本，但是重要且會影響到之後實作的項目概念有點疑惑，覺得應該查清楚，所以搞懂後記錄下來，寫下這篇文章(應該說是筆記？)。正文下面這段程式碼： model = Sequential() model.add

https://www.youtube.com/watch?v=wjZofJX0v4M 這是我看過最好的AI科普影片了；現在流行的GPT使用的大語言模型 (large language model, LLM), 是把每一個單字都當作一個高維度向量影片中GPT3共儲存50257個英文單字, 每

#AI #LLM #GPT

無限智慧學院的沙龍

2024/06/13

迎戰未來，AI 量子計算基礎篇 (1)，Single Systems

預計量子AI計算會在2032年左右來到，在這之前，我們還有充足的時間可以逐步去學習量子計算與演算法，讓我們按部就班，持續前進，做輕鬆無負擔的超前學習 !

#QuantumComputing #Qiskit #braket

王啟樺的沙龍

2024/05/15

055｜如何讓每天的學習都有目的和成果？

我常學習得到上面的課程。得到的每門課程，一講原則上是10分鐘錄音的長度。而這10分鐘錄音的逐字稿，我會將其切割成6-8塊資訊塊，每一個資訊塊大約是3-4個段落，以完整討論一個觀點的長度為主。我會根據每個資訊塊的內容，打上關鍵字的標籤，

創作邦｜設計X工具X品牌的沙龍

2024/05/01

我如何從零開始接觸與學習 AI，超詳細學習方法與心得

AI 相關的內容每天都非常多，有聽過很多人因此感覺到焦慮，怕錯過了最新資訊就會趕不上，這篇內容會跟大家詳細的分享我自己的學習方法和經驗，並且會在最後分享一些我的學習資訊來源。

#AI #學習 #創作

Mr. Colin 的沙龍

2024/03/05

速解：每天最重要的兩小時（上）閱讀時間：3 分鐘

本書介紹一些觀念和心理學原理，幫助我們在工作中做出更好的決定、利用情緒激發創意和提升心智表現…

#每天最重要的2小時 #閱讀心得

波士の思考

2024/02/22

《精準表達》24｜用數字表達可以減少誤會，還可以順便精簡說詞

你應該聽過有人開頭就說：「我簡單說明一下。」結果說個不停，10 分鐘了還聽不到想表達什麼，我們會不耐煩是因為對簡單說一下，到底是多簡單？要講多久？每個人的認知完全不一樣。如果說：「我用 2 分鐘簡單說明一下。」那麼你可以預期 2 分鐘就結束，對方沒做到還可以提醒他。如何確保訊息的精確傳遞

#溝通技巧 #使用數字 #減少誤會

私大教育所 (私人大學教育研究所) by mr gary

2024/01/22

《Brief AI 電子報》每日 3 分鐘掌握 AI 趨勢

http://tinyurl.com/12000ai888 http://tinyurl.com/12000ai888 http://tinyurl.com/12000ai888

MIA的宇宙

2025/01/09

國泰世華CUBE App 美的生活體驗，給予你最好的情緒。

#國泰世華 #CUBE卡 #金融

筱涵｜Hannah的沙龍

2025/01/02

【生活記事】AI人工智慧解籤｜慈母籤｜線上求籤｜科技與玄學

#互動設計 #文化體驗 #慈母籤

曼徹的矽谷旅記 Mencher’s Travelogue

2024/08/05

ML Infra 一大戰場 - 分散式訓練

#討論 #ML #LLM

筆記-深度學習參數理解："input_shape"

迎戰未來，AI 量子計算基礎篇 (1)，Single Systems

#QuantumComputing #Qiskit #braket

我如何從零開始接觸與學習 AI，超詳細學習方法與心得

#AI #學習 #創作

Mr. Colin 的沙龍

2024/03/05

速解：每天最重要的兩小時（上）閱讀時間：3 分鐘

本書介紹一些觀念和心理學原理，幫助我們在工作中做出更好的決定、利用情緒激發創意和提升心智表現…

#每天最重要的2小時 #閱讀心得

波士の思考

2024/02/22

《精準表達》24｜用數字表達可以減少誤會，還可以順便精簡說詞

#溝通技巧 #使用數字 #減少誤會

私大教育所 (私人大學教育研究所) by mr gary

2024/01/22

《Brief AI 電子報》每日 3 分鐘掌握 AI 趨勢

http://tinyurl.com/12000ai888 http://tinyurl.com/12000ai888 http://tinyurl.com/12000ai888