AI說書 - 從0開始 - 373 | 第十三章引言

發佈於三分鐘學AI (2)

更新於 2025/04/05發佈於 2025/04/05閱讀時間約 2 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

在前七章中，我們探索了幾個 Transformer 生態系統的架構訓練、微調和使用，在第 7 章「ChatGPT 的生成式 AI 革命」中，我們發現 OpenAI 已經開始嘗試 Zero-Shot 模型，這些模型不需要微調或開發，並且可以在幾行程式碼中實現。

這種演進的基本概念在於 Transformer 如何致力於教機器理解語言並以類似人類的方式表達自己，因此，我們已經從訓練模型發展到教導機器語言。

ChatGPT、New Bing、Gemini 和其他終端用戶軟體都可以進行摘要，那為什麼還要使用 T5 呢？因為 Hugging Face 的 T5 可能是你專案的合適解決方案，如我們將會看到的，它具有獨特的特性，例如專門針對摘要任務的參數設置。

Raffel 等人於 2019 年設計了一個基於簡單主張的 Transformer Meta 模型：每個 NLP 問題都可以表示為一個文本到文本的函數，每種類型的 NLP 任務都需要一些文本上下文，來生成某種形式的文本回應。

任何 NLP 任務的文本到文本表示提供了一個獨特的框架來分析 Transformer 的方法論和實踐，其核心思想是讓 Transformer 在訓練和微調階段通過文本到文本的方法進行遷移學習，以掌握語言。

Raffel 等人於 2019 年將這種方法命名為 Text-To-Text Transfer Transformer，這 5 個 T 組成了 T5，一個新模型因此誕生。

我們將從介紹 T5 Transformer 模型的概念和架構開始本章的內容，隨後，我們將使用 Hugging Face 的模型來應用 T5 進行文件摘要，本章中的範例將是法律和醫療領域的文檔，以探索特定領域的摘要，而不僅僅是簡單文本，我們並不是在尋找簡單的 NLP 實現方法，而是為現實生活中的項目做好準備。

#PromptEngineering

#chatgpt怎麼用

Learn AI 不 BI三分鐘學AI (2)AI從0開始-十三章

留言

留言分享你的想法！

Learn AI 不 BI

232會員

709內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2025/04/29

AI說書 - 從0開始 - 396 | 使用 ChatGPT 進行文章總結

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。想利用 AI說書 - 從0開始 - 395 | 使用 ChatGPT 進行文章總結中撰寫的 ChatGPT 彙整函數對文章進行總結功能，以下先載入文章： Text:

2025/04/29

AI說書 - 從0開始 - 396 | 使用 ChatGPT 進行文章總結

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。想利用 AI說書 - 從0開始 - 395 | 使用 ChatGPT 進行文章總結中撰寫的 ChatGPT 彙整函數對文章進行總結功能，以下先載入文章： Text:

2025/04/28

AI說書 - 從0開始 - 395 | 使用 ChatGPT 進行文章總結

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。為了後續方面，我們建立一個對話函數，這樣每次只要呼叫該函數即能完成對話： def dialog(uinput): role = "user" line = {"r

2025/04/28

AI說書 - 從0開始 - 395 | 使用 ChatGPT 進行文章總結

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。為了後續方面，我們建立一個對話函數，這樣每次只要呼叫該函數即能完成對話： def dialog(uinput): role = "user" line = {"r

2025/04/27

AI說書 - 從0開始 - 394 | 使用 ChatGPT 進行文章總結

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。想要使用 ChatGPT 進行文章總結，首先載入必要依賴： try: import openai from openai import OpenAI exc

2025/04/27

AI說書 - 從0開始 - 394 | 使用 ChatGPT 進行文章總結

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。想要使用 ChatGPT 進行文章總結，首先載入必要依賴： try: import openai from openai import OpenAI exc

#AI 的其他內容

出鞘的雙面刃：AI

目前共 10665 篇

方格子 vocus 官方沙龍

旅遊規劃，現在你也可以用 AI 來安排 #窩DEMAA

財經咖啡因的窩

南電#已經達標2026年預期的正常價值#ABF#合約負債

AppLab 數位研究社

Kiro 是什麼？Amazon 推出的 AI IDE，讓你像專業程式設計師般規劃與開發！

你可能也想看

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

創作者營運專員/經理（Operations Specialist/Manager）將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力，找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。

#vocus#方格子#求職

2025/06/23

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

創作者營運專員/經理（Operations Specialist/Manager）將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力，找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。

#vocus#方格子#求職

2025/06/23

Learn AI 不 BI

AI說書 - 從0開始 - 79

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。如 AI說書 - 從0開始 - 78 所述，經過 AI說書 - 從0開始 - 74 到目前為止的實驗，應可以漸漸感受到 Transformer 模型如何從數學層面漸漸往

#AI#ai#PromptEngineering

2024/07/08

Learn AI 不 BI

AI說書 - 從0開始 - 79

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。如 AI說書 - 從0開始 - 78 所述，經過 AI說書 - 從0開始 - 74 到目前為止的實驗，應可以漸漸感受到 Transformer 模型如何從數學層面漸漸往

#AI#ai#PromptEngineering

2024/07/08

Learn AI 不 BI

AI說書 - 從0開始 - 75

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 74 中提到，我們想要建立「Transformer 數學」與「ChatGPT 產生的文字」兩者間的關係。有鑑於此，我們以句子「

#AI#ai#PromptEngineering

2024/07/06

Learn AI 不 BI

AI說書 - 從0開始 - 75

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 74 中提到，我們想要建立「Transformer 數學」與「ChatGPT 產生的文字」兩者間的關係。有鑑於此，我們以句子「

#AI#ai#PromptEngineering

2024/07/06

Learn AI 不 BI

AI說書 - 從0開始 - 66

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先做個總回顧： Transformer 架構總覽：AI說書 - 從0開始 - 39 Attention 意圖說明：AI說書 - 從0開始 - 40 Transfo

#AI#ai#PositionalEncoding

2024/06/29

Learn AI 不 BI

AI說書 - 從0開始 - 66

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先做個總回顧： Transformer 架構總覽：AI說書 - 從0開始 - 39 Attention 意圖說明：AI說書 - 從0開始 - 40 Transfo

#AI#ai#PositionalEncoding

2024/06/29

Learn AI 不 BI

AI說書 - 從0開始 - 63

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 62 說：如果我參照原始 Google 釋出的 Transformer 論文的參數，在三個字的句子情況下，Single-Head At

#AI#ai#PositionalEncoding

2024/06/28

Learn AI 不 BI

AI說書 - 從0開始 - 63

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 62 說：如果我參照原始 Google 釋出的 Transformer 論文的參數，在三個字的句子情況下，Single-Head At

#AI#ai#PositionalEncoding

2024/06/28

Learn AI 不 BI

AI說書 - 從0開始 - 47

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧我們在AI說書 - 從0開始 - 41中，提及 Transformer 的 Encoder 架構如下圖所示：此外我已經在AI說書 - 從0開始 - 42中，

#AI#ai#PromptEngineering

2024/06/25

Learn AI 不 BI

AI說書 - 從0開始 - 47

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧我們在AI說書 - 從0開始 - 41中，提及 Transformer 的 Encoder 架構如下圖所示：此外我已經在AI說書 - 從0開始 - 42中，

#AI#ai#PromptEngineering

2024/06/25

Learn AI 不 BI

AI說書 - 從0開始 - 32

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。想要操作ChatGPT，我們可以參考OpenAI的範例： https://platform.openai.com/examples/default-sql-trans

#AI#ai#PromptEngineering

2024/06/19

Learn AI 不 BI

AI說書 - 從0開始 - 32

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。想要操作ChatGPT，我們可以參考OpenAI的範例： https://platform.openai.com/examples/default-sql-trans

#AI#ai#PromptEngineering

2024/06/19

Learn AI 不 BI

AI說書 - 從0開始 - 26

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 25示範了ChatGPT程式的能力，現在我們繼續做下去。 AI說書 - 從0開始 - 25在步驟7：Plot the confusio

#AI#ai#PromptEngineering

2024/06/17

Learn AI 不 BI

AI說書 - 從0開始 - 26

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 25示範了ChatGPT程式的能力，現在我們繼續做下去。 AI說書 - 從0開始 - 25在步驟7：Plot the confusio

#AI#ai#PromptEngineering

2024/06/17

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News