AI說書 - 從0開始 - 20

LearnAI

發佈於三分鐘學AI

更新於 2024/06/16發佈於 2024/06/16閱讀時間約 3 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

我們已經在AI說書 - 從0開始 - 19中，闡述了Inference的Pipeline為t = f(n)，現在我們做一些擴充與特點說明：

t = f(n)其實展開引入時間概念就是t_i= f(t₁, t₂, ... , t_i-1)，因此特點為：

Transformer Model的Dynamic特性展現在：由Incremental Input序列{ t₁, t₂, ... , t_i-1}來產生來產生Output t_i

該模型將適應全新的輸入並產生輸出

Transformer Model的Implicit特性展現在：The model encodes and stores relationships between tokens in weights and biases. It just keeps producing tokens based on its dynamic inputs based on millions of text, image, and audio data.

Transformer Model的Flexibility特性展現在：適應各種不同輸入，GPT模型均能產生輸出

接著引述書籍：Transformers for Natural Language Processing and Computer Vision, Denis Rothman, 2024，來闡述GPT模型的觀點：

Supervised and Unsupervised

Some may say that a GPT series model such as ChatGPT goes through unsupervised training. That statement is only true to a certain extent. Token by token, a GPT-like model finds its way to accuracy through self-supervised learning, predicting each subsequent token based on the preceding ones in the sequence. It succeeds in doing so through the influence of all the other tokens’ representations in a sequence.

We can also fine-tune a GPT model with an input (prompt) and output (completion) with labels! We can provide thousands of inputs (prompts) with one token as an output (completion). For example, we can create thousands of questions as inputs with only true and false as outputs. This is implicit supervised learning. Also, the model will not explicitly memorize the correct predictions. It will simply learn the patterns of the tokens.

Learn AI 不 BI三分鐘學AIAI從0開始-第一章

Learn AI 不 BI

188會員

501內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言0

查看全部

發表第一個留言支持創作者！

Learn AI 不 BI 的其他內容

AI說書 - 從0開始 - 19

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 18中，介紹了OpenAI的GPT模型如何利用Inference的Pipeline產生Token。完整Pipeline可能

#AI #ai #PromptEngineering

AI說書 - Prompt Engineering - 7

我們人類和ChatGPT的對話技巧也是需要學習的，有鑑於此，我想要一天分享一點「和ChatGPT對話的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。以下來談談生成式AI對未來世界的轉變：商業格局重新構想：邁向未來，生成式人工智慧成為改變商業格局

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 18

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 17中，介紹了大型語言模型 (LLM)世界裡面常用到的Token，現在我們來談談OpenAI的GPT模型如何利用Inference

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 17

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 16走過了部分AI發展軌跡，接著繼續：在1980年代Yann LeCun設計了Convolutional Neural N

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 16

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 15總結了Transformer比RNN還要好的結論，接著來鋪陳AI的歷史軌跡，以達到目前Transformer的巔峰。在19

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 15

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧我們在AI說書 - 從0開始 - 6中說當Context長度是n，且每個字用d維度的向量表示時有以下結論： Attention Layer的複雜度是O(n^2 *

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 19

#AI #ai #PromptEngineering

AI說書 - Prompt Engineering - 7

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 18

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 17

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 16

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 15

#AI #ai #PromptEngineering

你可能也想看

Google News 追蹤

曼徹的矽谷旅記 Mencher’s Travelogue

2024/08/05

ML Infra 一大戰場 - 分散式訓練

本系列將討論 LLM 時代中，分散 ML workload 的各種方法。作為系列的第一篇，我們將提及 High-level 的概論，譬如分散式訓練的各種切法、Model Parallelism 的相依問題，以及改善 Network Topology 等課題。

#討論 #ML #LLM

Vicky Mommy 玲玲

2024/07/20

AI 世界的底層邏輯與生存法則

今天來和你分享這本我剛讀完的「AI 世界的底層邏輯與生存法則」。當大家一股腦地想投入AI的領域當中時，這本書的作者程世嘉帶著我們用更高的視角和思維來思考，在AI時代下最重要的底層思考邏輯，找出那些最有價值的核心觀念，幫助我們在這個快速變化的世界當中站穩腳步，釐清未來的方向。

#AI #AI世界 #AI世界的底層邏輯與生存法則

柴郡貓姍蒂的沙龍

2024/06/29

筆記-深度學習參數理解："input_shape"

前言在閱讀《強化式學習：打造最強 AlphaZero 通用演算法》時，對一些看似基本，但是重要且會影響到之後實作的項目概念有點疑惑，覺得應該查清楚，所以搞懂後記錄下來，寫下這篇文章(應該說是筆記？)。正文下面這段程式碼： model = Sequential() model.add

https://www.youtube.com/watch?v=wjZofJX0v4M 這是我看過最好的AI科普影片了；現在流行的GPT使用的大語言模型 (large language model, LLM), 是把每一個單字都當作一個高維度向量影片中GPT3共儲存50257個英文單字, 每

#AI #LLM #GPT

無限智慧學院的沙龍

2024/06/13

迎戰未來，AI 量子計算基礎篇 (1)，Single Systems

預計量子AI計算會在2032年左右來到，在這之前，我們還有充足的時間可以逐步去學習量子計算與演算法，讓我們按部就班，持續前進，做輕鬆無負擔的超前學習 !

#QuantumComputing #Qiskit #braket

張詠芯 AbbyChang 的沙龍

2024/06/09

ep.48 成長思維與面對焦慮｜成長筆記

今天接觸到兩個重點方向，我覺得每個人都可以去嘗試思考，也是我最近在試著去了解更深的主軸： ①提升思維、善用AI工具。包括接觸商業和產品知識，再用工具加速、更有效達標。 ②自媒體——讓人認識你。如果要做自媒體，可以先思考目的，比如我的目標是寫作出書，就不需要花太多時間分享生活娛

#成長思維 #成長 #焦慮

創作邦｜設計X工具X品牌的沙龍

2024/05/01

我如何從零開始接觸與學習 AI，超詳細學習方法與心得

AI 相關的內容每天都非常多，有聽過很多人因此感覺到焦慮，怕錯過了最新資訊就會趕不上，這篇內容會跟大家詳細的分享我自己的學習方法和經驗，並且會在最後分享一些我的學習資訊來源。

#AI #學習 #創作

王啟樺的沙龍

2024/04/25

LLM 003｜人工智慧如何從數據中學習？

大語言模型能夠生成文本，因此被認為是生成式人工智慧的一種形式。人工智慧的學科任務，是製作機器，使其能執行需要人類智慧才能執行的任務，例如理解語言，便是模式，做出決策。除了大語言模型，人工智慧也包含了深度學習以及機器學習。機器學習的學科任務，是透過演算法來實踐AI。特別

#大語言模型 #ChatGPT #人工智慧

36號矩陣 | 軟體相關部落格

2024/02/19

人工智慧迎來技術大躍進，淺談人工智能模型 (LLM)的影響

前言在AI經歷數個冰河期後，終於在後疫情時代來到了一個技術高峰，而這個破冰者就是OPen AI(ChatGPT)，對於這個話題不管你是是正在接觸AI，對AI技術有些了解的人，抑或是專業領域上對於AI介入感到焦慮的人都希望可以文中得到收穫。本文想分享一些個人對於AI的理解及對於LLM模型的一些

#AI #軟體開發 #網頁開發

私大教育所 (私人大學教育研究所) by mr gary

2024/01/22

《Brief AI 電子報》每日 3 分鐘掌握 AI 趨勢

http://tinyurl.com/12000ai888 http://tinyurl.com/12000ai888 http://tinyurl.com/12000ai888

曼徹的矽谷旅記 Mencher’s Travelogue

2024/08/05

ML Infra 一大戰場 - 分散式訓練

#討論 #ML #LLM

Vicky Mommy 玲玲

2024/07/20

AI 世界的底層邏輯與生存法則

#AI #AI世界 #AI世界的底層邏輯與生存法則

柴郡貓姍蒂的沙龍

2024/06/29

筆記-深度學習參數理解："input_shape"

迎戰未來，AI 量子計算基礎篇 (1)，Single Systems

#QuantumComputing #Qiskit #braket

我如何從零開始接觸與學習 AI，超詳細學習方法與心得

#AI #學習 #創作

王啟樺的沙龍

2024/04/25

LLM 003｜人工智慧如何從數據中學習？

#大語言模型 #ChatGPT #人工智慧

36號矩陣 | 軟體相關部落格

2024/02/19

人工智慧迎來技術大躍進，淺談人工智能模型 (LLM)的影響

#AI #軟體開發 #網頁開發

私大教育所 (私人大學教育研究所) by mr gary

2024/01/22

《Brief AI 電子報》每日 3 分鐘掌握 AI 趨勢

http://tinyurl.com/12000ai888 http://tinyurl.com/12000ai888 http://tinyurl.com/12000ai888