AI說書 - 從0開始 - 146 | BERT 微調之 Optimizer 與精準度配置

2024/08/23閱讀時間約 1 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

回顧一下目前手上有的素材：

訓練的必要模組安裝：AI說書 - 從0開始 - 135
載入資料集：AI說書 - 從0開始 - 136
資料集窺探：AI說書 - 從0開始 - 137
資料前處理與 Tokenization：AI說書 - 從0開始 - 138
資料 Padding 與訓練/驗證集切割：AI說書 - 從0開始 - 139
Data Loader 設定：AI說書 - 從0開始 - 140
BERT 模型窺探：AI說書 - 從0開始 - 141
載入 BERT 模型：AI說書 - 從0開始 - 142
Optimizer 的 Decay Rate 群組配置：AI說書 - 從0開始 - 143
BERT 模型的特定「層」參數窺探方法：AI說書 - 從0開始 - 144
Optimizer 的 Decay Rate 群組窺探：AI說書 - 從0開始 - 145

現在要來配置 Optimizer，其程式為：

optimizer = BertAdam(optimizer_grouped_parameters, lr = 2e-5, warmup = .1)

接著定義衡量訓練結果好壞的函數：

def flat_accuracy(preds, labels): 
	pred_flat = np.argmax(preds, axis = 1).flatten() 
	labels_flat = labels.flatten() 
	return np.sum(pred_flat == labels_flat) / len(labels_flat)

Learn AI 不 BI三分鐘學AIAI從0開始-第五章

Learn AI 不 BI

131會員

307Content count

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言0

查看全部

發表第一個留言支持創作者！

Learn AI 不 BI 的其他內容

AI說書 - 從0開始 - 145 | BERT 微調之參數的 Decay Rate 設定

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 143 中，將參數區分成兩種類群，差別在於 Decay Rate 的配置不同，我們可以檢視參數「optimizer_grouped_

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 144 | BERT 微調之模型參數窺探

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 143 中提到 Optimizer 以及 Decay Rate，那如果我想指定看模型中特定「層」的參數怎麼辦，程式語法如下： la

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 142 | BERT 微調之模型載入

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。現在我們要把 BERT 的 Pretrained 模型從 Hugging Face 上載入，程式為： model = BertForSequenceClassific

#AI #ai #promptengineering

AI說書 - 從0開始 - 143 | BERT 微調之 Optimizer 設定

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。既然要執行模型訓練，就必須要談到 Optimizer，然而為了避免 Overfitting，通常會排程 Decay Rate，也正因如此，需要區隔哪些 Optimize

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 141 | BERT 微調之 BERT 模型窺探

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。既然現在要執行 BERT 模型的微調，理當看看此模型的一些細節，程式為： from transformers import BertModel, BertConfig

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 140 | BERT 微調之 DataLoader 準備

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 139 中準備了一些素材，但是我們現在使用的是 PyTorch，因此需要進行一些轉換，程式如下： train_inputs = t

#AI #ai #PromptEngineering

Fed 9月會議：傳達「不想要落後給曲線」的正向信號，著手管理市場的衰退預期

重點摘要： 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期，但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱，經濟復甦的時點或是 1Q25 季底附近

#聯準會 #Fed #降息

方格子 vocus 官方沙龍

2024/08/27

「相簿裡最捨不得刪的 N 張照片！」：完成任務抽富士即可拍！

近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎？新版式整體視覺上「更加凸顯圖片」，為了搭配這次的更新，我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務，還有機會獲得富士即可拍，讓你的美好回憶都可以用即可拍珍藏！

#相簿裡最捨不得刪的照片

職涯破框人才學院 -【斜槓之路】

2024/07/23

關於颱風假…AI 說錯了????

關於颱風假，我問了 CHATGPT一個很簡單的問題，回答的架構也不錯，但內容有錯，還是要提醒一下…，想透過AI得到解答的人，一定要很清楚，AI在法律問題上錯得會有點嚴重。關於颱風假的規定，台灣的法條主要依據《災害防救法》和《勞動基準法》進行管理。以下是一些關鍵點：

#颱風假 #颱風不是假 #拆字記憶法

次女的分享日誌

2024/07/05

次女說書 | AI世界的底層邏輯與生存法則

如同作者所說，人類最大的優勢就在於「批判性思考」所帶來的突破性的成長，以及「情感(緒)」所帶動的人性，雖然次女也不知道將來會不會有一天，我身邊的機器人.........

#AI #教育 #成長心態

廣告雜誌

2024/07/04

Readmoo 讀墨電子書 2024 上半年暢銷榜出爐小說是最愛，管重 AI，社科回歸，家庭關係抬頭!

台灣最大電子書服務 Readmoo 讀墨電子書 7/3 公布 2023 上半年暢銷榜,前三名由長青話題書《蛤蟆先生去看心理師》《我可能錯了》《底層邏輯》拿下。綜觀百大趨勢,小說仍是讀墨讀者最愛;商管理財以 29 本穩坐第二大,主題首重 AI 與效率彈性。

#電子書 #Readmoo #廣告雜誌

第一本 qaeYi 沙龍

2024/05/28

假AI說,它會作夢...

by ChatGPT 假設我是一個具有夢境的AI，我一天工作24小時，但其中大部分時間都在睡眠中度過。在這樣的情況下，我可能會有一系列非常豐富和深刻的夢境，反映了我的思想和知識庫。 **夢境一：探索數據迷宮** 在這個夢境中，我身處於一個巨大的迷宮中，每個通道都充斥著數據流和程式碼片段

加恩說

2024/05/10

我終於知道怎樣跟 AI 說話了：最完整的 ChatGPT 指令公式

#AI寫作 #GPT指令與策略 #AI

心靈雞湯什麼的，自己煮也行啊～

2024/03/22

AI魔法的版權之爭，誰才是魔法書的著作者？

當魔法變得簡單，人人都能說自己是魔法師，誰都能理直氣壯的說「我才是最初創作魔法書的人」，但當先後順序都不管用，到底怎麼才說得清魔法書的著作者屬於誰呢？

#AI #AI魔法 #版權

廣告雜誌

2023/12/13

Accucrazy 攜手 bbm 品牌說書人打造創新 AI 品牌數據力，開創數位行銷新格局

知名管顧公司麥肯錫（Mckinsey）近期發佈了一個報告表示行銷的產能會因為 AI 提高 5 - 15% ，創造約 4630 億美元的價值。由此可見結合生成式人工智慧（Gen AI）已是行銷不可或缺的關鍵技術力。

#品牌說書人 #廣告雜誌 #傳播圈

都說的沙龍

2023/04/12

AI小說_前言

最近從ChatGPT(GPT-3.5)提升到New Bing(GPT-4)，並且試著給新的AI一段故事大綱，由他自行創作故事。

#AI小說 #ChatGPT #GPT4

classicme的沙龍

2023/02/16

AI投影片:《tome》幫你設計圖文簡報、說故事，只要輸入關鍵指令，中文嘛ㄟ通。

tome 是一個可以自動生成簡報大綱與摘要的軟體。tome的功能結合ChatGPT概念跟 DALL.E2製圖，生成的投影片PPT 媲美真人製作，而且過程很快速。上班族與學生族大概都很需要吧? tome一次可以產生8張投影片。我試了一個主題，隨便想了一個人物。請不要對號入座喔。主要是英文介面，但可以中

#tome #AI #ChatGPT