LLM 001｜大語言模型如何革新傳統的自然語言處理任務？

王啟樺

發佈於LLM 筆記

2024/04/23 更新2024/04/23 發佈閱讀 1 分鐘

大語言模型，例如OpenAI提供的ChatGPT，是過去幾年發展的深度神經網路模型，開啟自然語言處理的新紀元。

大語言模型之前，傳統方法在歸類任務，例如垃圾郵件分類，手寫模式辨別等能寫出規則的任務上表現良好。然而解析詳細指示，脈絡分析，構造連貫與脈絡洽當的原創文本等需要複雜理解與推廣能力的任務上，傳統方法就沒辦法了。

實際上，傳統方法無法從一串關鍵字就寫一封郵件，但這個任務對現代的大語言模型是小菜一碟。

大語言模型有很好的能力去理解，生成，詮釋人類語言。

然而，當我們說語言模型「理解」，具體指的是語言模型能夠處理文本，並且產生通順，連貫，脈絡洽當的文本，而不代表他們有像人類一樣的意識或領悟。

大語言模型的能力，是由深度學習的進展而解鎖的。

大語言模型透過大量的文本數據訓練，能比傳統方法更好抓住人類語言的脈絡資訊以及微妙之處。

如此，大語言模型顯著改良的大量自然語言處理任務的表現，包含文本翻譯，情感分析，問答。

此外，大語言模型在各種自然語言處理任務都展現出相當的熟練度，是為特定任務設計的傳統自然語言模型無法企及的。

大語言模型的成功歸因於Transformer架構與大量的訓練數據，使其能夠「編碼」各種語言上的微妙，脈絡，以及表達模式。

透過Transfomer架構與大量數據訓練大語言模型的這個趨勢，從根本改變了自然語言處理這個領域。

大語言模型成為了理解人類語言，與人類語言互動的全能工具。

本書的主要目標，是透過程式碼一步一步在Transformer架構上，實踐項ChatGPT一樣的大語言模型，藉此來理解大語言模型。

#大語言模型

#ChatGPT

王啟樺的沙龍LLM 筆記

留言

留言分享你的想法！

王啟樺的沙龍

645會員

2.0K內容數

Outline as Content

王啟樺的沙龍的其他內容

2024/04/28

LLM 006｜BERT與GPT是怎麼從Transformer演化來的？

在上一期「LLM 005｜大語言模型是如何利用Transformer理解語言的？」我們提到，Transformer是大語言模型理解語言的關鍵。而Transformer架構兩個主要的後代是BERT以及GPT。 BERT是bidirectional encoder representati

2024/04/28

LLM 006｜BERT與GPT是怎麼從Transformer演化來的？

2024/04/27

LLM 005｜大語言模型是如何利用Transformer理解語言的？

現代大語言模型建構於Transformer結構。 Transformer結構是源自於2017年著名論文 Attention Is All You Need的深度神經網路結構。原始的Trasformer是為了機器翻譯發展，當初的任務是將英文翻譯成德文與法文。 Transformer

2024/04/27

LLM 005｜大語言模型是如何利用Transformer理解語言的？

2024/04/26

LLM 004｜創建大語言模型需要哪兩個關鍵階段？

從頭開始寫大語言模型的程式碼，是最好理解大語言模型的機制與限制的方風。從頭開始寫大語言模型的程式碼，可以幫助我們得到預訓練與微調整開源大語言模型架構所需要的知識，並應用到特定領域的數據及以及任務。客製化大語言模型一般來說比起通用大語言模型有更好的表現。一個具體的例子是

2024/04/26

LLM 004｜創建大語言模型需要哪兩個關鍵階段？

看更多

你可能也想看

廣告雜誌

從資料清洗到 RAG，大型語言模型的必需品，做出專屬企業的 AI 知識庫！

在當今快速變化的數位時代，企業面臨著前所未有的數據處理需求。為了應對這些挑戰，企業紛紛建立自己的大型語言模型（LLM），利用大量數據進行訓練，讓模型能夠理解並生成自然語言，從而實現人機協作，優化業務流程並提升客戶體驗。

#廣告雜誌#專欄#cacaFly

2024/07/31

廣告雜誌

從資料清洗到 RAG，大型語言模型的必需品，做出專屬企業的 AI 知識庫！

#廣告雜誌#專欄#cacaFly

2024/07/31

Learn AI 不 BI

AI說書 - Prompt Engineering - 6

我們人類和ChatGPT的對話技巧也是需要學習的，有鑑於此，我想要一天分享一點「和ChatGPT對話的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。針對Generative AI、Foundation Model、Large Language Mode

#AI#ai#PromptEngineering

2024/06/12

Learn AI 不 BI

AI說書 - Prompt Engineering - 6

#AI#ai#PromptEngineering

2024/06/12

生之道 ShengZhiDao

中文系也能和科技產生連接：略分享語言資訊處理的階段發展與趨勢

這篇文章討論了自然語言處理技術的發展歷程，從語言模型的引入到深度學習的應用。作者觀察到現今GPT在產出中文國學內容時的深度不足，並提出了自然語言處理領域的倫理使用和版權問題，以及對大眾的影響。最後，作者探討了個人在自然語言領域的發展可能性。

#語言#資訊#模型

2024/06/05

生之道 ShengZhiDao

中文系也能和科技產生連接：略分享語言資訊處理的階段發展與趨勢

#語言#資訊#模型

2024/06/05

程式輕鬆玩

ChatGPT：人工智慧的對話夥伴

ChatGPT（全名：聊天生成預訓練轉換器）是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出，使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型，並以強化學習進行訓練。

2024/05/15

2024/05/15

筆記-曲博談AI模型.群聯-24.05.05

筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型三個步驟: 1.預訓練，訓練一次要用幾萬顆處理器、訓練時間要1個月，ChatGPT訓練一次的成本為1000萬美金。 2.微調(

2024/05/06

每日發車

筆記-曲博談AI模型.群聯-24.05.05

2024/05/06

iBonnie_愛邦尼

語言模型初探

語言模型與文字表示以不同的方式來分析自然語言的詞語分佈及語意關係。本文章簡要介紹了語言模型、Word2vec、FastText、GloVe和Transformer等技術，並提供了實際的應用參考點，幫助讀者深入理解自然語言處理的技術。

2024/04/17

2024/04/17

這陣子使用AI模型，還有參考國內外一些喜歡玩語言模型的同好發文，一個很有趣的結論就是，有時候把大型語言模型(尤其ChatGPT)當作一個人來溝通，會得到比較好的結果，這的確是非常反直覺的，也就是說很多時候ChatGPT耍懶不肯工作的時候，你用加油打氣，或是情緒勒索的方法，確實是可以得到比較好的結果。

#chatgpt#LLM#AI

2024/03/31