AI說書 - 從0開始 - 93

更新於 2024/07/17發佈於 2024/07/16閱讀時間約 2 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

下游任務是一個 Fine-Tuned 的 Transformer 任務，它從預先訓練的 Transformer 模型繼承模型和參數，故，下游任務是運行微調任務的預訓練模型的視角，亦即：「A Task is Downstream if it Was Not Used to Fully Pretrain the Model」

The Corpus of Linguistic Acceptability (CoLA)，是一項 GLUE 任務，詳見網址 https://gluebenchmark.com/tasks，包含數千個帶有語法可接受性註解的英語句子樣本，Alex Warstadt 等人於 2019 的目標在於評估 NLP 模型的語言能力，以判斷句子的語言可接受性，NLP 模型預計會對句子進行相應的分類，如果該句子在語法上不可接受，則該句子被標記為 0，如果該句子語法上可以接受，則該句子被標記為 1，例如：

Classification = 1 for we yelled ourselves hoarse.
Classification = 0 for we yelled ourselves.

如果想要感覺 CoLA 的能力，可以使用下列程式載入資料集：

#source of dataset : https://nyu-mll.github.io/CoLA/ 
df = pd.read_csv("in_domain_train.csv", delimiter = '\t', header = None, names = ['sentence_source', 'label', 'label_notes', 'sentence'])

然後使用 Hugging Face 載入 Pretrained 的 BERT (Bidirectional Encoder Representations from Transformers) 模型：

model = BertForSequenceClassification.from_pretrained("bert-base-uncased", num_labels = 2)

至於衡量的基準則選擇 MCC，詳見 AI說書 - 從0開始 - 83

Learn AI 不 BI三分鐘學AIAI從0開始-第三章

Learn AI 不 BI

214會員

543內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言

留言分享你的想法！

Learn AI 不 BI 的其他內容

AI說書 - 從0開始 - 92

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 87 說：Wang 等人 2019 年的論文，提供了合理答案的選擇 (Choice of Plausible Answers, COP

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 91

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 90

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 89

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 88

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。以下陳述任務 (Task)、模型 (Model)、微調 (Fine-Tuning)、GLUE (General Language Understanding Evalu

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 87

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 86 提及 SuperGLUE 任務清單，當中會包含以下欄位：名稱 (Name)：經過微調的預訓練模型的下游任務的名稱標識符

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 92

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 91

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 90

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 89

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 88

#AI #ai #PromptEngineering

AI說書 - 從0開始 - 87

#AI #ai #PromptEngineering

你可能也想看

Google News 追蹤

方格子 vocus 官方沙龍

2025/03/31

【vocus 新商品上架】創作者打氣包🚨 4 月限定，免費數位商品

靈感用盡、鍵盤不再響，盯著喜歡、分享、留言的數字，心跳跟著小鈴鐺七上八下⋯⋯vocus 2025 年 4 月限定新商品，要為創作者打氣！ 🚨「創作者打氣包」最懂創作者的vocus，為創作者打造 ✨ 打氣包，包什麼？！四件道具挺創作者一、【打氣復活卷】專屬你的打氣小語，成功登記免費

#創作 #愚人節 #免費數位商品

方格子 vocus 官方沙龍

2025/03/24

「方格人氣王」挑戰賽🏆！發文互動拿禮物，登上首頁曝光！

全新 vocus 挑戰活動「方格人氣王」來啦～四大挑戰任你選，留言 / 愛心 / 瀏覽數大 PK，還有新手專屬挑戰！無論你是 vocus 上活躍創作者或剛加入的新手，都有機會被更多人看見，獲得站上版位曝光＆豐富獎勵！🏆

#方格人氣王 #方格留言王 #方格愛心王

曼徹的矽谷旅記 Mencher’s Travelogue

2024/08/05

ML Infra 一大戰場 - 分散式訓練

本系列將討論 LLM 時代中，分散 ML workload 的各種方法。作為系列的第一篇，我們將提及 High-level 的概論，譬如分散式訓練的各種切法、Model Parallelism 的相依問題，以及改善 Network Topology 等課題。

#討論 #ML #LLM

柴郡貓姍蒂的沙龍

2024/06/29

筆記-深度學習參數理解："input_shape"

前言在閱讀《強化式學習：打造最強 AlphaZero 通用演算法》時，對一些看似基本，但是重要且會影響到之後實作的項目概念有點疑惑，覺得應該查清楚，所以搞懂後記錄下來，寫下這篇文章(應該說是筆記？)。正文下面這段程式碼： model = Sequential() model.add

https://www.youtube.com/watch?v=wjZofJX0v4M 這是我看過最好的AI科普影片了；現在流行的GPT使用的大語言模型 (large language model, LLM), 是把每一個單字都當作一個高維度向量影片中GPT3共儲存50257個英文單字, 每

#AI #LLM #GPT

無限智慧學院的沙龍

2024/06/13

迎戰未來，AI 量子計算基礎篇 (1)，Single Systems

預計量子AI計算會在2032年左右來到，在這之前，我們還有充足的時間可以逐步去學習量子計算與演算法，讓我們按部就班，持續前進，做輕鬆無負擔的超前學習 !

#QuantumComputing #Qiskit #braket

每日發車

2024/05/06

筆記-曲博談AI模型.群聯-24.05.05

筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型三個步驟: 1.預訓練，訓練一次要用幾萬顆處理器、訓練時間要1個月，ChatGPT訓練一次的成本為1000萬美金。 2.微調(

創作邦｜設計X工具X品牌的沙龍

2024/05/01

我如何從零開始接觸與學習 AI，超詳細學習方法與心得

AI 相關的內容每天都非常多，有聽過很多人因此感覺到焦慮，怕錯過了最新資訊就會趕不上，這篇內容會跟大家詳細的分享我自己的學習方法和經驗，並且會在最後分享一些我的學習資訊來源。

#AI #學習 #創作

王啟樺的沙龍

2024/04/25

LLM 003｜人工智慧如何從數據中學習？

大語言模型能夠生成文本，因此被認為是生成式人工智慧的一種形式。人工智慧的學科任務，是製作機器，使其能執行需要人類智慧才能執行的任務，例如理解語言，便是模式，做出決策。除了大語言模型，人工智慧也包含了深度學習以及機器學習。機器學習的學科任務，是透過演算法來實踐AI。特別

#大語言模型 #ChatGPT #人工智慧

先學會為自己綻放，再給懂你的人欣賞。

加油！以生成式AI 創建，各式各樣客製化精準學習AI BOT！

這篇文章介紹瞭如何利用生成式AI（GenAI）來提高學習效率，包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度，保持學術誠信，適當運用GenAI能大幅提升工作效率。

#學習 #生成式AI #文章

ezra.share.injoy

2024/03/10

學習筆記【生成式AI導論 2024】第4講：訓練不了人工智慧？你可以訓練你自己 (中) — 拆解問題與使用工具

延續上週提到的，「有哪些不訓練模型的情況下，能夠強化語言模型的能力」，這堂課接續介紹其中第 3、4 個方法

#AI #生成式AI #學習

方格子 vocus 官方沙龍

2025/03/31

【vocus 新商品上架】創作者打氣包🚨 4 月限定，免費數位商品

#創作 #愚人節 #免費數位商品

方格子 vocus 官方沙龍

2025/03/24

「方格人氣王」挑戰賽🏆！發文互動拿禮物，登上首頁曝光！

#方格人氣王 #方格留言王 #方格愛心王

曼徹的矽谷旅記 Mencher’s Travelogue

2024/08/05

ML Infra 一大戰場 - 分散式訓練

#討論 #ML #LLM

柴郡貓姍蒂的沙龍

2024/06/29

筆記-深度學習參數理解："input_shape"

迎戰未來，AI 量子計算基礎篇 (1)，Single Systems

#QuantumComputing #Qiskit #braket

每日發車

2024/05/06

筆記-曲博談AI模型.群聯-24.05.05

創作邦｜設計X工具X品牌的沙龍

2024/05/01

我如何從零開始接觸與學習 AI，超詳細學習方法與心得

#AI #學習 #創作

王啟樺的沙龍

2024/04/25

LLM 003｜人工智慧如何從數據中學習？

#大語言模型 #ChatGPT #人工智慧

先學會為自己綻放，再給懂你的人欣賞。

加油！以生成式AI 創建，各式各樣客製化精準學習AI BOT！

#學習 #生成式AI #文章

ezra.share.injoy

2024/03/10

學習筆記【生成式AI導論 2024】第4講：訓練不了人工智慧？你可以訓練你自己 (中) — 拆解問題與使用工具

延續上週提到的，「有哪些不訓練模型的情況下，能夠強化語言模型的能力」，這堂課接續介紹其中第 3、4 個方法

#AI #生成式AI #學習