AI說書 - 從0開始 - 229 | 微調 GPT 模型引言

2024/10/27 更新2024/10/27 發佈閱讀 2 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

OpenAI 提供了一項微調模型清單的服務，包括 GPT-3 系列、GPT-4、Babbage-002 和 Davinci 的模型，其中一些模型是建議的，而其他模型是實驗性的，但最終是否選擇這些模型取決於您。

經過微調的模型可以像原始模型一樣執行資料探索、分類、問答和其他 NLP 任務，因此，微調模型可能會產生可接受或不準確的結果，品質控制仍然至關重要，確保在開始專案之前閱讀 OpenAI 的文檔：https://platform.openai.com/docs/guides/fine-tuning/

微調 GPT 模型涉及四個階段，我們將逐一實現：

資料準備
使用 Babbage-002 模型微調 GPT-3 架構以執行生成任務
執行微調後的模型
模型管理

Learn AI 不 BI三分鐘學AI (2)AI從0開始-第八章

留言

留言分享你的想法！

Learn AI 不 BI

242會員

935內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2024/11/11

AI說書 - 從0開始 - 244 | 第八章額外閱讀項目

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 227 | 第八章引言到 AI說書 - 從0開始 - 243 | 微調 GPT 模型與 GPT4 比較，我們完成書籍：Transfor

2024/11/11

AI說書 - 從0開始 - 244 | 第八章額外閱讀項目

2024/11/10

AI說書 - 從0開始 - 243 | 微調 GPT 模型與 GPT4 比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先列出目前擁有的材料：微調 GPT 模型引言：AI說書 - 從0開始 - 229 | 微調 GPT 模型引言微調 GPT 模型的前置步驟：AI說書 - 從0開始

2024/11/10

AI說書 - 從0開始 - 243 | 微調 GPT 模型與 GPT4 比較

2024/11/09

AI說書 - 從0開始 - 242 | 微調 GPT 模型與 GPT4 比較

2024/11/09

AI說書 - 從0開始 - 242 | 微調 GPT 模型與 GPT4 比較

看更多

你可能也想看

金日子的沙龍

【假日錢進系列 Vol.3】雙十一補貨攻略：靠小步驟打造無壓力被動收入

探討雙十一購物節如何從血拼轉為理性補貨，並介紹蝦皮分潤計畫，教你如何透過日常購物累積小額被動收入。文章分享個人購物清單（貓罐頭、Snoopy口罩、康寧杯），並提供詳細的分潤計畫申請步驟與優勢，強調此為零壓力、零門檻的理財新方式。

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/06

金日子的沙龍

【假日錢進系列 Vol.3】雙十一補貨攻略：靠小步驟打造無壓力被動收入

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/06

阿展米糕的沙龍

不出門、不備貨、不上班也能賺？我用蝦皮分潤計畫開啟小副業

厭倦了單純消費？這篇文章帶你認識「蝦皮分潤計畫」，將你的購物習慣轉化為額外收入。從德州撲克牌組、實用晒衣架的購物經驗，到雙11購物清單與省錢技巧，作者分享如何利用分潤機制，讓每一筆花費都可能變現，實現「邊買邊賺」的雙贏局面。同時提供註冊指南與網賺優勢，邀請你也一同加入。

#方格人氣王#分享#開箱

2025/11/05

阿展米糕的沙龍

不出門、不備貨、不上班也能賺？我用蝦皮分潤計畫開啟小副業

#方格人氣王#分享#開箱

2025/11/05

Learn AI 不 BI

AI說書 - 從0開始 - 84

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。繼 AI說書 - 從0開始 - 82 與 xxx ，我們談論了衡量 AI 模型的方式，那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時，需要

#AI#ai#PromptEngineering

2024/07/12

Learn AI 不 BI

AI說書 - 從0開始 - 84

#AI#ai#PromptEngineering

2024/07/12

Learn AI 不 BI

AI說書 - 從0開始 - 82

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 可以透過繼承預訓練模型 (Pretrained Model) 來微調 (Fine-Tune) 以執行下游任務。 Pretrained Mo

#AI#ai#PromptEngineering

2024/07/10

Learn AI 不 BI

AI說書 - 從0開始 - 82

#AI#ai#PromptEngineering

2024/07/10

Learn AI 不 BI

AI說書 - 從0開始 - 32

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。想要操作ChatGPT，我們可以參考OpenAI的範例： https://platform.openai.com/examples/default-sql-trans

#AI#ai#PromptEngineering

2024/06/19

Learn AI 不 BI

AI說書 - 從0開始 - 32

#AI#ai#PromptEngineering

2024/06/19

Learn AI 不 BI

AI說書 - 從0開始 - 23

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 22解釋Foundation Model與Engines意涵後，我們來試用看看ChatGPT。嘗試問以下問題：Provide a

#AI#ai#PromptEngineering

2024/06/17

Learn AI 不 BI

AI說書 - 從0開始 - 23

#AI#ai#PromptEngineering

2024/06/17

Learn AI 不 BI

AI說書 - 從0開始 - 19

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 18中，介紹了OpenAI的GPT模型如何利用Inference的Pipeline產生Token。完整Pipeline可能

#AI#ai#PromptEngineering

2024/06/16

Learn AI 不 BI

AI說書 - 從0開始 - 19

#AI#ai#PromptEngineering

2024/06/16

Learn AI 不 BI

AI說書 - 從0開始 - 18

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 17中，介紹了大型語言模型 (LLM)世界裡面常用到的Token，現在我們來談談OpenAI的GPT模型如何利用Inference

#AI#ai#PromptEngineering

2024/06/15

Learn AI 不 BI

AI說書 - 從0開始 - 18

#AI#ai#PromptEngineering

2024/06/15

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News