Learn AI 不 BI

AI說書 - 從0開始 - 150 | BERT 微調之推論程式

發佈於三分鐘學AI

更新於 2024/08/26發佈於 2024/08/26閱讀時間約 1 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

回顧一下目前手上有的素材：

訓練的必要模組安裝：AI說書 - 從0開始 - 135
載入資料集：AI說書 - 從0開始 - 136
資料集窺探：AI說書 - 從0開始 - 137
資料前處理與 Tokenization：AI說書 - 從0開始 - 138
資料 Padding 與訓練/驗證集切割：AI說書 - 從0開始 - 139
Data Loader 設定：AI說書 - 從0開始 - 140
BERT 模型窺探：AI說書 - 從0開始 - 141
載入 BERT 模型：AI說書 - 從0開始 - 142
Optimizer 的 Decay Rate 群組配置：AI說書 - 從0開始 - 143
BERT 模型的特定「層」參數窺探方法：AI說書 - 從0開始 - 144
Optimizer 的 Decay Rate 群組窺探：AI說書 - 從0開始 - 145
配置 Optimizer 與訓練成效評估函數：AI說書 - 從0開始 - 146
訓練程式的撰寫：AI說書 - 從0開始 - 147
訓練結果圖示化：AI說書 - 從0開始 - 148
準備驗證微調效果的另一份資料前處理：AI說書 - 從0開始 - 149

現在載入 AI說書 - 從0開始 - 149 準備好的 Data Loader，並執行預測：

model.eval()

raw_predictions, predicted_classes, true_labels = [], [], []

def softmax(logits): 
	e = np.exp(logits) 
	return e / np.sum(e)


for batch in prediction_dataloader:
	batch = tuple(t.to(device) for t in batch)
	b_input_ids, b_input_mask, b_labels = batch
	with torch.no_grad():
		outputs = model(b_input_ids, token_type_ids = None, attention_mask = b_input_mask)
	
	logits = outputs['logits'].detach().cpu().numpy() 
	
	label_ids = b_labels.to('cpu').numpy()
	b_input_ids = b_input_ids.to('cpu').numpy()
	batch_sentences = [tokenizer.decode(input_ids, skip_special_tokens = True) for input_ids in b_input_ids]
	
	probabilities = torch.nn.functional.softmax(torch.tensor(logits), dim = -1)
	batch_predictions = np.argmax(probabilities, axis = 1)
	
	for i, sentence in enumerate(batch_sentences):
		print(f"Sentence: {sentence}")
		print(f"Prediction: {logits[i]}")
		print(f"Sofmax probabilities", softmax(logits[i]))
		print(f"Prediction: {batch_predictions[i]}")
		print(f"True label: {label_ids[i]}")
	
	raw_predictions.append(logits) 
	predicted_classes.append(batch_predictions) 
	true_labels.append(label_ids)

最後來看看結果，首先看句子本身長什麼樣子：

raw-image

接著是預測結果，用 Logits 來表示：

raw-image

接著經過轉換，變成機率形式：

raw-image

兩機率相比較，得到預測結果，BERT 模型說句子文法是對的：

raw-image

句子的文法真實結果確實是對的：

raw-image

#PromptEngineering

#chatgpt怎麼用

Learn AI 不 BI三分鐘學AIAI從0開始-第五章

Learn AI 不 BI

182會員

487內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言0

查看全部

發表第一個留言支持創作者！

Learn AI 不 BI 的其他內容

AI說書 - 從0開始 - 149 | BERT 微調之用另一份資料檢視微調效果

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧一下目前手上有的素材：訓練的必要模組安裝：AI說書 - 從0開始 - 135 載入資料集：AI說書 - 從0開始 - 136 資料集窺探：AI說書 - 從0

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 148 | BERT 微調之訓練過程圖繪製

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 147 完成了訓練程式的撰寫，現在我們來看輸出長什麼樣子：可以看到驗證集的準確度隨著訓練次數增加而提升，也可以做更細部的呈現

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 147 | BERT 微調之訓練程式撰寫

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧一下目前手上有的素材：訓練的必要模組安裝：AI說書 - 從0開始 - 135 載入資料集：AI說書 - 從0開始 - 136 資料集窺探：AI說書 - 從0

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 146 | BERT 微調之 Optimizer 與精準度配置

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧一下目前手上有的素材：訓練的必要模組安裝：AI說書 - 從0開始 - 135 載入資料集：AI說書 - 從0開始 - 136 資料集窺探：AI說書 - 從0

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 145 | BERT 微調之參數的 Decay Rate 設定

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 143 中，將參數區分成兩種類群，差別在於 Decay Rate 的配置不同，我們可以檢視參數「optimizer_grouped_

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 144 | BERT 微調之模型參數窺探

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 143 中提到 Optimizer 以及 Decay Rate，那如果我想指定看模型中特定「層」的參數怎麼辦，程式語法如下： la

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 149 | BERT 微調之用另一份資料檢視微調效果

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧一下目前手上有的素材：訓練的必要模組安裝：AI說書 - 從0開始 - 135 載入資料集：AI說書 - 從0開始 - 136 資料集窺探：AI說書 - 從0

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 148 | BERT 微調之訓練過程圖繪製

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 147 完成了訓練程式的撰寫，現在我們來看輸出長什麼樣子：可以看到驗證集的準確度隨著訓練次數增加而提升，也可以做更細部的呈現

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 147 | BERT 微調之訓練程式撰寫

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧一下目前手上有的素材：訓練的必要模組安裝：AI說書 - 從0開始 - 135 載入資料集：AI說書 - 從0開始 - 136 資料集窺探：AI說書 - 從0

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 146 | BERT 微調之 Optimizer 與精準度配置

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧一下目前手上有的素材：訓練的必要模組安裝：AI說書 - 從0開始 - 135 載入資料集：AI說書 - 從0開始 - 136 資料集窺探：AI說書 - 從0

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 145 | BERT 微調之參數的 Decay Rate 設定

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 143 中，將參數區分成兩種類群，差別在於 Decay Rate 的配置不同，我們可以檢視參數「optimizer_grouped_

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 144 | BERT 微調之模型參數窺探

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 143 中提到 Optimizer 以及 Decay Rate，那如果我想指定看模型中特定「層」的參數怎麼辦，程式語法如下： la

#AI #ai #PromptEngineering

你可能也想看

Google News 追蹤

閒水鴨的沙龍

連媽媽都會用！輕鬆養成專屬自己的質感金融生活圈

/ 大家現在出門買東西還會帶錢包嗎鴨鴨發現自己好像快一個禮拜沒帶錢包出門還是可以天天買滿買好回家(? 因此為了記錄手機消費跟各種紅利優惠鴨鴨都會特別注意銀行的App好不好用！像是介面設計就是會很在意的地方很多銀行通常會為了要滿足不同客群會推出很多App讓使用者下載每次

#國泰世華銀行 #國泰世華 #國泰世華CUBEApp

Learn AI 不 BI

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 39 至 AI說書 - 從0開始 - 69 的第二章內容，我們拿 Encoder 出來看：幾點注意如下： BERT 模型使用 M

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 109 | BLEU 評分機制前言

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。總結一下目前有的素材： AI說書 - 從0開始 - 103：資料集載入 AI說書 - 從0開始 - 104：定義資料清洗的函數 AI說書 - 從0開始 - 105

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 105 | AI 資料準備

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經有資料集在 AI說書 - 從0開始 - 103 ，必要的清理函數在 AI說書 - 從0開始 - 104 ，現在把它們湊在一起，如下： # load Eng

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 71

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 37 到 AI說書 - 從0開始 - 70 ，我們完成書籍：Transformers for Natural Language Proc

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 66

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先做個總回顧： Transformer 架構總覽：AI說書 - 從0開始 - 39 Attention 意圖說明：AI說書 - 從0開始 - 40 Transfo

#AI #ai #PositionalEncoding

Learn AI 不 BI

AI說書 - 從0開始 - 59

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 54

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 29

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在AI說書 - 從0開始 - 28中闡述了一些AI專業者的未來發展方向，現在我們更細分：人工智慧專家在人工智慧某一領域擁有專業知識或技能，包含微調模型、維護和支

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 26

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 25示範了ChatGPT程式的能力，現在我們繼續做下去。 AI說書 - 從0開始 - 25在步驟7：Plot the confusio

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 14

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。已經在AI說書 - 從0開始 - 12以及AI說書 - 從0開始 - 13中見識到TPU的威力了，現在我們把參數放大到真實大型語言模型的規模，看看運算時間的等級。

#AI #ai #PromptEngineering

閒水鴨的沙龍

連媽媽都會用！輕鬆養成專屬自己的質感金融生活圈

/ 大家現在出門買東西還會帶錢包嗎鴨鴨發現自己好像快一個禮拜沒帶錢包出門還是可以天天買滿買好回家(? 因此為了記錄手機消費跟各種紅利優惠鴨鴨都會特別注意銀行的App好不好用！像是介面設計就是會很在意的地方很多銀行通常會為了要滿足不同客群會推出很多App讓使用者下載每次

#國泰世華銀行 #國泰世華 #國泰世華CUBEApp

Learn AI 不 BI

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 39 至 AI說書 - 從0開始 - 69 的第二章內容，我們拿 Encoder 出來看：幾點注意如下： BERT 模型使用 M

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 109 | BLEU 評分機制前言

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。總結一下目前有的素材： AI說書 - 從0開始 - 103：資料集載入 AI說書 - 從0開始 - 104：定義資料清洗的函數 AI說書 - 從0開始 - 105

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 105 | AI 資料準備

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經有資料集在 AI說書 - 從0開始 - 103 ，必要的清理函數在 AI說書 - 從0開始 - 104 ，現在把它們湊在一起，如下： # load Eng

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 71

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 37 到 AI說書 - 從0開始 - 70 ，我們完成書籍：Transformers for Natural Language Proc

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 66

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。先做個總回顧： Transformer 架構總覽：AI說書 - 從0開始 - 39 Attention 意圖說明：AI說書 - 從0開始 - 40 Transfo

#AI #ai #PositionalEncoding

Learn AI 不 BI

AI說書 - 從0開始 - 59

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 54

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。目前我們已經完成： Single-Head Attention 數學說明：AI說書 - 從0開始 - 52 Multi-Head Attention 數學說明：AI

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 29

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在AI說書 - 從0開始 - 28中闡述了一些AI專業者的未來發展方向，現在我們更細分：人工智慧專家在人工智慧某一領域擁有專業知識或技能，包含微調模型、維護和支

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 26

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續AI說書 - 從0開始 - 25示範了ChatGPT程式的能力，現在我們繼續做下去。 AI說書 - 從0開始 - 25在步驟7：Plot the confusio

#AI #ai #PromptEngineering

Learn AI 不 BI

AI說書 - 從0開始 - 14

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。已經在AI說書 - 從0開始 - 12以及AI說書 - 從0開始 - 13中見識到TPU的威力了，現在我們把參數放大到真實大型語言模型的規模，看看運算時間的等級。

#AI #ai #PromptEngineering