基本提示

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

2024/08/13

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 129 中說，Bidirectional Encoder Representations from Transformers (BER

AI說書 - 從0開始 - 125 | 第五章目錄

2024/08/10

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在某些情況下，別人提供的 Pretrained Transformer Model 效果不盡人意，可能會想要自己做 Pretrained Model，但是這會耗費大量運

2024/07/14

AI說書 - 從0開始 - 88

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。以下陳述任務 (Task)、模型 (Model)、微調 (Fine-Tuning)、GLUE (General Language Understanding Evalu

GM 001｜語言模型真的能生成真實的表格數據嗎？

2024/06/29

今天聊聊由 Vadim Borisov[1]於2023年發表的文章，《Language Models are Realistic Tabular Data Generators》[2]。這篇文章的看點，是提出了GReaT 框架，實現使用「大語言模型 Large Language Mo

2024/06/15

AI說書 - 從0開始 - 18

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 17中，介紹了大型語言模型 (LLM)世界裡面常用到的Token，現在我們來談談OpenAI的GPT模型如何利用Inference

2024/06/13

C003｜為什麼大語言模型的嵌入需要這麼多維度？

大語言模型通常會生產自己的「嵌入 Embedding」作為部分的輸入層，並且在大語言模型的訓練途中不斷優化嵌入的方式，以對特定的任務特定的數據優化。而大語言模型使用的「嵌入維度 Embedding Dimension」通常是高維度的，例如最小的GPT-2模型有1億1千

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。已經在AI說書 - 從0開始 - 12以及AI說書 - 從0開始 - 13中見識到TPU的威力了，現在我們把參數放大到真實大型語言模型的規模，看看運算時間的等級。

朵小芸的草味沙龍

2024/06/06

SLM是什麼？探索小型語言模型的未來趨勢

在AI時代中，GPT技術正在改變我們的生活。然而，SLM（小型語言模型）也開始受到關注，具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。

#SLM #LLM #大語言模型

2024/01/19

【大語言模型LLMs：為何「大」字至關重要？】

大語言模型（LLMs）對於任何對人工智能和自然語言處理感興趣的人來說都是一個令人興奮的領域。這類模型，如GPT-4，透過其龐大的數據集和複雜的參數設置，提供了前所未有的語言理解和生成能力。那麼，究竟是什麼讓這些模型「大」得如此不同呢？

#大語言模型 #GPT4 #ChatGPT

【從規則到革新：3大進步展示了大語言模型在自然語言處理上的威力】

2024/01/15

對於熱衷於語言科技的你，大語言模型（LLMs）在自然語言處理（NLP）領域的發展無疑是一個革命性的進展。從傳統的規則系統到基於深度學習的方法， LLMs展現了在理解、生成和翻譯人類語言方面的巨大突破。這不僅是技術上的飛躍，更是開啟了新的應用和可能性。下面將介紹這一變革帶來的三大

#大語言模型 #ChatGPT #深度學習

方格子 vocus 官方沙龍

2025/03/24

「方格人氣王」挑戰賽🏆！發文互動拿禮物，登上首頁曝光！

#方格人氣王 #方格留言王 #方格愛心王

Compostela

2025/03/19

AI 筆記工具大評比：NotebookLM、OneNote、Notion AI 分析

全方位分析脫離繼承戰的方法，大膽猜測誰會成為卡丁國下一任國王。

#獵人 #HUNTER×HUNTER #繼承戰懶人包

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

2024/08/13

AI說書 - 從0開始 - 125 | 第五章目錄

2024/08/10

2024/07/14

AI說書 - 從0開始 - 88

GM 001｜語言模型真的能生成真實的表格數據嗎？

2024/06/29

2024/06/15

AI說書 - 從0開始 - 18

2024/06/13

C003｜為什麼大語言模型的嵌入需要這麼多維度？

【大語言模型LLMs：為何「大」字至關重要？】

#大語言模型 #GPT4 #ChatGPT