更新於 2024/08/18閱讀時間約 1 分鐘

AI說書 - 從0開始 - 136 | BERT 微調之訓練資料匯入

我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。


AI說書 - 從0開始 - 135 安裝載入了必要程式模組後,今天來匯入 CoLA 資料 (

https://nyu-mll. github.io/CoLA/),程式為:

import os

!curl -L https://raw.githubusercontent.com/Denis2054/Transformers-for-NLP-and-Computer-Vision-3rd-Edition/master/Chapter05/in_domain_train.tsv --output "in_ domain_train.tsv"
!curl -L https://raw.githubusercontent.com/Denis2054/Transformers-for-NLP-and-Computer-Vision-3rd-Edition/master/Chapter05/out_of_domain_dev.tsv --output "out_of_domain_dev.tsv"


完成後,將在 Google Colab 的左邊資料夾欄位看到:


分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.