AI說書 - 從0開始 - 137 | BERT 微調之訓練資料窺探

2024/08/18閱讀時間約 1 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

我們已經在 AI說書 - 從0開始 - 136 載入了本次 Fine-Tuning 需要的 CoLA 資料集 (詳見 AI說書 - 從0開始 - 93 )，我們可以對此資料集有更深一層次的了解：

df = pd.read_csv("in_domain_train.tsv", delimiter='\t', header = None, names = ['sentence_source', 'label', 'label_notes', 'sentence'])
df.shape

其結果如下所示：

我們可以隨機挑 10 筆資料出來看看長怎麽樣：

欄位說明如下：

sentence_source：資料來源
label：1 代表句子文法可被接受，0 代表句子文法不可被接受
label_notes：作者的註釋
sentence：等待被判斷語法是否可被接受的句子

Learn AI 不 BI三分鐘學AIAI從0開始-第五章

Learn AI 不 BI

131會員

307Content count

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言0

查看全部

發表第一個留言支持創作者！

Learn AI 不 BI 的其他內容

AI說書 - 從0開始 - 136 | BERT 微調之訓練資料匯入

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。繼 AI說書 - 從0開始 - 135 安裝載入了必要程式模組後，今天來匯入 CoLA 資料 ( https://nyu-mll. github.io/CoLA/)，

AI說書 - 從0開始 - 137 | BERT 微調之訓練資料窺探

AI說書 - 從0開始 - 136 | BERT 微調之訓練資料匯入

AI說書 - 從0開始 - 135 | BERT 微調所需的相關依賴安裝

AI說書 - 從0開始 - 134 | BERT 微調目標主題與衡量標準

AI說書 - 從0開始 - 133 | BERT 模型微調引言

AI說書 - 從0開始 - 132 | BERT 的訓練

AI說書 - 從0開始 - 131 | Next Sentence Prediction 訓練

AI說書 - 從0開始 - 136 | BERT 微調之訓練資料匯入

AI說書 - 從0開始 - 135 | BERT 微調所需的相關依賴安裝

AI說書 - 從0開始 - 134 | BERT 微調目標主題與衡量標準

AI說書 - 從0開始 - 133 | BERT 模型微調引言

AI說書 - 從0開始 - 132 | BERT 的訓練

AI說書 - 從0開始 - 131 | Next Sentence Prediction 訓練

你可能也想看

Fed 9月會議：傳達「不想要落後給曲線」的正向信號，著手管理市場的衰退預期

「相簿裡最捨不得刪的 N 張照片！」：完成任務抽富士即可拍！

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

AI說書 - 從0開始 - 126 | BERT 引言

AI說書 - 從0開始 - 122 | 第四章額外閱讀項目

AI說書 - 從0開始 - 109 | BLEU 評分機制前言

AI說書 - 從0開始 - 105 | AI 資料準備

AI說書 - 從0開始 - 71

AI說書 - 從0開始 - 66

AI說書 - 從0開始 - 54

AI說書 - 從0開始 - 29

Fed 9月會議：傳達「不想要落後給曲線」的正向信號，著手管理市場的衰退預期

「相簿裡最捨不得刪的 N 張照片！」：完成任務抽富士即可拍！

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

AI說書 - 從0開始 - 126 | BERT 引言

AI說書 - 從0開始 - 122 | 第四章額外閱讀項目

AI說書 - 從0開始 - 109 | BLEU 評分機制前言

AI說書 - 從0開始 - 105 | AI 資料準備

AI說書 - 從0開始 - 71

AI說書 - 從0開始 - 66

AI說書 - 從0開始 - 54

AI說書 - 從0開始 - 29