AI說書 - 從0開始 - 125 | 第五章目錄

更新於 2024/08/10發佈於 2024/08/10閱讀時間約 1 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

在某些情況下，別人提供的 Pretrained Transformer Model 效果不盡人意，可能會想要自己做 Pretrained Model，但是這會耗費大量運算資源、資料等等，於是想要做 Fine-Tuning。

這個章節會教導如何從 Hugging Face 抓 BERT 模型下來執行 Fine-Tuning，一旦這個學會，將能夠抓取其他在 Hugging Face 上的模型來執行 Fine-Tuning，例如 GPT、T5、RoBERTa 等模型。

BERT 模型全名為 Bidirectional Encoder Representations from Transformers，其只包含 Encoder Block 而不包含 Decoder Block。

本章節將包含：

BERT 模型架構
Encoder 模組、Bidirectional Attention 機制
創造訓練資料、標籤、Token
資料分割為 Training Set 與 Validation Set
設定 Hugging Face 原始 BERT 模型
設定訓練的 Hyperparameter
執行訓練
建立 Python 聊天介面

Learn AI 不 BI三分鐘學AIAI從0開始-第五章

Learn AI 不 BI

195會員

510內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言

留言分享你的想法！

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

Learn AI 不 BI 的其他內容

AI說書 - 從0開始 - 122 | 第四章額外閱讀項目

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 99 到 AI說書 - 從0開始 - 121，我們完成書籍：Transformers for Natural Language Proc

#AI #ai #promptengineering

AI說書 - 從0開始 - 121 | Back-Translation 使用情境

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 120 中使用 Google Gemini 將一段英文翻譯成法文，那我不是法文專業者，怎麼知道翻譯的好不好呢？我可以使用 B

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 120 | Google Gemini 使用

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。現在我們來看看 Google Gemini (https://gemini.google.com/ to start a dialog) 的能力：回答如下：

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 119 | 使用 GoogleTrans 進行翻譯

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 118 安裝完 googletrans，現在示範如何從英文翻譯成法文： import googletrans translator

#AI #ai #promptengineering

AI說書 - Prompt Engineering - 70 | Prompt 結論

我們人類和ChatGPT的對話技巧也是需要學習的，有鑑於此，我想要一天分享一點「和ChatGPT對話的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。加州理工學院噴射推進實驗室的 David Van Buren 深入研究了大型語言模型 (LLM) 在模擬

#AI #ai #PromptEngineer

AI說書 - Prompt Engineering - 69 | Mega-Personas 介紹

我們人類和ChatGPT的對話技巧也是需要學習的，有鑑於此，我想要一天分享一點「和ChatGPT對話的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在多角色方法的基礎上，Lance Eliot 於 2023 年引入了 “Mega-Personas” 方

#AI #ai #PromptEngineer

AI說書 - 從0開始 - 122 | 第四章額外閱讀項目

#AI #ai #promptengineering

AI說書 - 從0開始 - 121 | Back-Translation 使用情境

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 120 | Google Gemini 使用

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 119 | 使用 GoogleTrans 進行翻譯

#AI #ai #promptengineering

AI說書 - Prompt Engineering - 70 | Prompt 結論

#AI #ai #PromptEngineer

AI說書 - Prompt Engineering - 69 | Mega-Personas 介紹

#AI #ai #PromptEngineer

你可能也想看

Google News 追蹤

曼徹的矽谷旅記 Mencher’s Travelogue

2024/08/05

ML Infra 一大戰場 - 分散式訓練

本系列將討論 LLM 時代中，分散 ML workload 的各種方法。作為系列的第一篇，我們將提及 High-level 的概論，譬如分散式訓練的各種切法、Model Parallelism 的相依問題，以及改善 Network Topology 等課題。

#討論 #ML #LLM

柴郡貓姍蒂的沙龍

2024/07/23

筆記-深度學習模型訓練：利用殘差網路做影像辨識

前言讀了許多理論，是時候實際動手做做看了，以下是我的模型訓練初體驗，有點糟就是了XD。正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,

https://www.youtube.com/watch?v=wjZofJX0v4M 這是我看過最好的AI科普影片了；現在流行的GPT使用的大語言模型 (large language model, LLM), 是把每一個單字都當作一個高維度向量影片中GPT3共儲存50257個英文單字, 每

#AI #LLM #GPT

每日發車

2024/05/06

筆記-曲博談AI模型.群聯-24.05.05

筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型三個步驟: 1.預訓練，訓練一次要用幾萬顆處理器、訓練時間要1個月，ChatGPT訓練一次的成本為1000萬美金。 2.微調(

創作邦｜設計X工具X品牌的沙龍

2024/05/01

我如何從零開始接觸與學習 AI，超詳細學習方法與心得

AI 相關的內容每天都非常多，有聽過很多人因此感覺到焦慮，怕錯過了最新資訊就會趕不上，這篇內容會跟大家詳細的分享我自己的學習方法和經驗，並且會在最後分享一些我的學習資訊來源。

#AI #學習 #創作

王啟樺的沙龍

2024/04/25

LLM 003｜人工智慧如何從數據中學習？

大語言模型能夠生成文本，因此被認為是生成式人工智慧的一種形式。人工智慧的學科任務，是製作機器，使其能執行需要人類智慧才能執行的任務，例如理解語言，便是模式，做出決策。除了大語言模型，人工智慧也包含了深度學習以及機器學習。機器學習的學科任務，是透過演算法來實踐AI。特別

#大語言模型 #ChatGPT #人工智慧

易樂的沙龍

2024/03/24

加油！以生成式AI 創建，各式各樣客製化精準學習AI BOT！

這篇文章介紹瞭如何利用生成式AI（GenAI）來提高學習效率，包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度，保持學術誠信，適當運用GenAI能大幅提升工作效率。

#學習 #生成式AI #文章

ezra.share.injoy

2024/03/10

學習筆記【生成式AI導論 2024】第4講：訓練不了人工智慧？你可以訓練你自己 (中) — 拆解問題與使用工具

延續上週提到的，「有哪些不訓練模型的情況下，能夠強化語言模型的能力」，這堂課接續介紹其中第 3、4 個方法

#AI #生成式AI #學習

36號矩陣 | 軟體相關部落格

2024/02/19

人工智慧迎來技術大躍進，淺談人工智能模型 (LLM)的影響

前言在AI經歷數個冰河期後，終於在後疫情時代來到了一個技術高峰，而這個破冰者就是OPen AI(ChatGPT)，對於這個話題不管你是是正在接觸AI，對AI技術有些了解的人，抑或是專業領域上對於AI介入感到焦慮的人都希望可以文中得到收穫。本文想分享一些個人對於AI的理解及對於LLM模型的一些

#AI #軟體開發 #網頁開發

私大教育所 (私人大學教育研究所) by mr gary

2024/01/22

《Brief AI 電子報》每日 3 分鐘掌握 AI 趨勢

http://tinyurl.com/12000ai888 http://tinyurl.com/12000ai888 http://tinyurl.com/12000ai888

曼徹的矽谷旅記 Mencher’s Travelogue

2024/08/05

ML Infra 一大戰場 - 分散式訓練

#討論 #ML #LLM

柴郡貓姍蒂的沙龍

2024/07/23

筆記-深度學習模型訓練：利用殘差網路做影像辨識

筆記-曲博談AI模型.群聯-24.05.05

創作邦｜設計X工具X品牌的沙龍

2024/05/01

我如何從零開始接觸與學習 AI，超詳細學習方法與心得

#AI #學習 #創作

王啟樺的沙龍

2024/04/25

LLM 003｜人工智慧如何從數據中學習？

#大語言模型 #ChatGPT #人工智慧

易樂的沙龍

2024/03/24

加油！以生成式AI 創建，各式各樣客製化精準學習AI BOT！

#學習 #生成式AI #文章

ezra.share.injoy

2024/03/10

學習筆記【生成式AI導論 2024】第4講：訓練不了人工智慧？你可以訓練你自己 (中) — 拆解問題與使用工具

延續上週提到的，「有哪些不訓練模型的情況下，能夠強化語言模型的能力」，這堂課接續介紹其中第 3、4 個方法

#AI #生成式AI #學習

36號矩陣 | 軟體相關部落格

2024/02/19

人工智慧迎來技術大躍進，淺談人工智能模型 (LLM)的影響

#AI #軟體開發 #網頁開發

私大教育所 (私人大學教育研究所) by mr gary

2024/01/22

《Brief AI 電子報》每日 3 分鐘掌握 AI 趨勢

http://tinyurl.com/12000ai888 http://tinyurl.com/12000ai888 http://tinyurl.com/12000ai888