Learn AI 不 BI

AI說書 - 從0開始 - 150 | BERT 微調之推論程式

LearnAI

2024/08/26閱讀時間約 1 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

回顧一下目前手上有的素材：

訓練的必要模組安裝：AI說書 - 從0開始 - 135
載入資料集：AI說書 - 從0開始 - 136
資料集窺探：AI說書 - 從0開始 - 137
資料前處理與 Tokenization：AI說書 - 從0開始 - 138
資料 Padding 與訓練/驗證集切割：AI說書 - 從0開始 - 139
Data Loader 設定：AI說書 - 從0開始 - 140
BERT 模型窺探：AI說書 - 從0開始 - 141
載入 BERT 模型：AI說書 - 從0開始 - 142
Optimizer 的 Decay Rate 群組配置：AI說書 - 從0開始 - 143
BERT 模型的特定「層」參數窺探方法：AI說書 - 從0開始 - 144
Optimizer 的 Decay Rate 群組窺探：AI說書 - 從0開始 - 145
配置 Optimizer 與訓練成效評估函數：AI說書 - 從0開始 - 146
訓練程式的撰寫：AI說書 - 從0開始 - 147
訓練結果圖示化：AI說書 - 從0開始 - 148
準備驗證微調效果的另一份資料前處理：AI說書 - 從0開始 - 149

現在載入 AI說書 - 從0開始 - 149 準備好的 Data Loader，並執行預測：

model.eval()

raw_predictions, predicted_classes, true_labels = [], [], []

def softmax(logits): 
	e = np.exp(logits) 
	return e / np.sum(e)


for batch in prediction_dataloader:
	batch = tuple(t.to(device) for t in batch)
	b_input_ids, b_input_mask, b_labels = batch
	with torch.no_grad():
		outputs = model(b_input_ids, token_type_ids = None, attention_mask = b_input_mask)
	
	logits = outputs['logits'].detach().cpu().numpy() 
	
	label_ids = b_labels.to('cpu').numpy()
	b_input_ids = b_input_ids.to('cpu').numpy()
	batch_sentences = [tokenizer.decode(input_ids, skip_special_tokens = True) for input_ids in b_input_ids]
	
	probabilities = torch.nn.functional.softmax(torch.tensor(logits), dim = -1)
	batch_predictions = np.argmax(probabilities, axis = 1)
	
	for i, sentence in enumerate(batch_sentences):
		print(f"Sentence: {sentence}")
		print(f"Prediction: {logits[i]}")
		print(f"Sofmax probabilities", softmax(logits[i]))
		print(f"Prediction: {batch_predictions[i]}")
		print(f"True label: {label_ids[i]}")
	
	raw_predictions.append(logits) 
	predicted_classes.append(batch_predictions) 
	true_labels.append(label_ids)

最後來看看結果，首先看句子本身長什麼樣子：

raw-image

接著是預測結果，用 Logits 來表示：

raw-image

接著經過轉換，變成機率形式：

raw-image

兩機率相比較，得到預測結果，BERT 模型說句子文法是對的：

raw-image

句子的文法真實結果確實是對的：

raw-image

#PromptEngineering

#chatgpt怎麼用

Learn AI 不 BI三分鐘學AIAI從0開始-第五章

Learn AI 不 BI

132會員

309Content count

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言0

查看全部

發表第一個留言支持創作者！

Learn AI 不 BI 的其他內容

AI說書 - 從0開始 - 149 | BERT 微調之用另一份資料檢視微調效果

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧一下目前手上有的素材：訓練的必要模組安裝：AI說書 - 從0開始 - 135 載入資料集：AI說書 - 從0開始 - 136 資料集窺探：AI說書 - 從0

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 148 | BERT 微調之訓練過程圖繪製

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 147 完成了訓練程式的撰寫，現在我們來看輸出長什麼樣子：可以看到驗證集的準確度隨著訓練次數增加而提升，也可以做更細部的呈現

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 147 | BERT 微調之訓練程式撰寫

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧一下目前手上有的素材：訓練的必要模組安裝：AI說書 - 從0開始 - 135 載入資料集：AI說書 - 從0開始 - 136 資料集窺探：AI說書 - 從0

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 146 | BERT 微調之 Optimizer 與精準度配置

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧一下目前手上有的素材：訓練的必要模組安裝：AI說書 - 從0開始 - 135 載入資料集：AI說書 - 從0開始 - 136 資料集窺探：AI說書 - 從0

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 145 | BERT 微調之參數的 Decay Rate 設定

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 143 中，將參數區分成兩種類群，差別在於 Decay Rate 的配置不同，我們可以檢視參數「optimizer_grouped_

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 144 | BERT 微調之模型參數窺探

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 143 中提到 Optimizer 以及 Decay Rate，那如果我想指定看模型中特定「層」的參數怎麼辦，程式語法如下： la

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 149 | BERT 微調之用另一份資料檢視微調效果

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧一下目前手上有的素材：訓練的必要模組安裝：AI說書 - 從0開始 - 135 載入資料集：AI說書 - 從0開始 - 136 資料集窺探：AI說書 - 從0

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 148 | BERT 微調之訓練過程圖繪製

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 147 完成了訓練程式的撰寫，現在我們來看輸出長什麼樣子：可以看到驗證集的準確度隨著訓練次數增加而提升，也可以做更細部的呈現

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 147 | BERT 微調之訓練程式撰寫

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧一下目前手上有的素材：訓練的必要模組安裝：AI說書 - 從0開始 - 135 載入資料集：AI說書 - 從0開始 - 136 資料集窺探：AI說書 - 從0

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 146 | BERT 微調之 Optimizer 與精準度配置

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧一下目前手上有的素材：訓練的必要模組安裝：AI說書 - 從0開始 - 135 載入資料集：AI說書 - 從0開始 - 136 資料集窺探：AI說書 - 從0

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 145 | BERT 微調之參數的 Decay Rate 設定

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 143 中，將參數區分成兩種類群，差別在於 Decay Rate 的配置不同，我們可以檢視參數「optimizer_grouped_

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 144 | BERT 微調之模型參數窺探

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 143 中提到 Optimizer 以及 Decay Rate，那如果我想指定看模型中特定「層」的參數怎麼辦，程式語法如下： la

#AI #ai #PromptEngineering

你可能也想看

美股韭菜王

Fed 9月會議：傳達「不想要落後給曲線」的正向信號，著手管理市場的衰退預期

重點摘要： 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期，但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱，經濟復甦的時點或是 1Q25 季底附近

#聯準會 #Fed #降息

方格子 vocus 官方沙龍

「相簿裡最捨不得刪的 N 張照片！」：完成任務抽富士即可拍！

近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎？新版式整體視覺上「更加凸顯圖片」，為了搭配這次的更新，我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務，還有機會獲得富士即可拍，讓你的美好回憶都可以用即可拍珍藏！

#相簿裡最捨不得刪的照片

Learn AI 不 BI

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 39 至 AI說書 - 從0開始 - 69 的第二章內容，我們拿 Encoder 出來看：幾點注意如下： BERT 模型使用 M

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 109 | BLEU 評分機制前言

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。總結一下目前有的素材： AI說書 - 從0開始 - 103：資料集載入 AI說書 - 從0開始 - 104：定義資料清洗的函數 AI說書 - 從0開始 - 105

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 105 | AI 資料準備

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經有資料集在 AI說書 - 從0開始 - 103 ，必要的清理函數在 AI說書 - 從0開始 - 104 ，現在把它們湊在一起，如下： # load Eng

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 71

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 37 到 AI說書 - 從0開始 - 70 ，我們完成書籍：Transformers for Natural Language Proc

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 66

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先做個總回顧： Transformer 架構總覽：AI說書 - 從0開始 - 39 Attention 意圖說明：AI說書 - 從0開始 - 40 Transfo

#AI #ai #PositionalEncoding

Learn AI 不 BI

AI說書 - 從0開始 - 59

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 54

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 29

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在AI說書 - 從0開始 - 28中闡述了一些AI專業者的未來發展方向，現在我們更細分：人工智慧專家在人工智慧某一領域擁有專業知識或技能，包含微調模型、維護和支

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 26

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 25示範了ChatGPT程式的能力，現在我們繼續做下去。 AI說書 - 從0開始 - 25在步驟7：Plot the confusio

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 14

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。已經在AI說書 - 從0開始 - 12以及AI說書 - 從0開始 - 13中見識到TPU的威力了，現在我們把參數放大到真實大型語言模型的規模，看看運算時間的等級。

#AI #ai #PromptEngineering

美股韭菜王

Fed 9月會議：傳達「不想要落後給曲線」的正向信號，著手管理市場的衰退預期

重點摘要： 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期，但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱，經濟復甦的時點或是 1Q25 季底附近

#聯準會 #Fed #降息

方格子 vocus 官方沙龍

「相簿裡最捨不得刪的 N 張照片！」：完成任務抽富士即可拍！

近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎？新版式整體視覺上「更加凸顯圖片」，為了搭配這次的更新，我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務，還有機會獲得富士即可拍，讓你的美好回憶都可以用即可拍珍藏！

#相簿裡最捨不得刪的照片

Learn AI 不 BI

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 39 至 AI說書 - 從0開始 - 69 的第二章內容，我們拿 Encoder 出來看：幾點注意如下： BERT 模型使用 M

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 109 | BLEU 評分機制前言

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。總結一下目前有的素材： AI說書 - 從0開始 - 103：資料集載入 AI說書 - 從0開始 - 104：定義資料清洗的函數 AI說書 - 從0開始 - 105

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 105 | AI 資料準備

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經有資料集在 AI說書 - 從0開始 - 103 ，必要的清理函數在 AI說書 - 從0開始 - 104 ，現在把它們湊在一起，如下： # load Eng

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 71

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 37 到 AI說書 - 從0開始 - 70 ，我們完成書籍：Transformers for Natural Language Proc

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 66

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先做個總回顧： Transformer 架構總覽：AI說書 - 從0開始 - 39 Attention 意圖說明：AI說書 - 從0開始 - 40 Transfo

#AI #ai #PositionalEncoding

Learn AI 不 BI

AI說書 - 從0開始 - 59

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 54

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 29

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在AI說書 - 從0開始 - 28中闡述了一些AI專業者的未來發展方向，現在我們更細分：人工智慧專家在人工智慧某一領域擁有專業知識或技能，包含微調模型、維護和支

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 26

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 25示範了ChatGPT程式的能力，現在我們繼續做下去。 AI說書 - 從0開始 - 25在步驟7：Plot the confusio

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 14

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。已經在AI說書 - 從0開始 - 12以及AI說書 - 從0開始 - 13中見識到TPU的威力了，現在我們把參數放大到真實大型語言模型的規模，看看運算時間的等級。

#AI #ai #PromptEngineering