LLM 001｜大語言模型如何革新傳統的自然語言處理任務？

王啟樺

發佈於LLM 筆記

更新於 2024/04/23發佈於 2024/04/23閱讀時間約 1 分鐘

大語言模型，例如OpenAI提供的ChatGPT，是過去幾年發展的深度神經網路模型，開啟自然語言處理的新紀元。

大語言模型之前，傳統方法在歸類任務，例如垃圾郵件分類，手寫模式辨別等能寫出規則的任務上表現良好。然而解析詳細指示，脈絡分析，構造連貫與脈絡洽當的原創文本等需要複雜理解與推廣能力的任務上，傳統方法就沒辦法了。

實際上，傳統方法無法從一串關鍵字就寫一封郵件，但這個任務對現代的大語言模型是小菜一碟。

大語言模型有很好的能力去理解，生成，詮釋人類語言。

然而，當我們說語言模型「理解」，具體指的是語言模型能夠處理文本，並且產生通順，連貫，脈絡洽當的文本，而不代表他們有像人類一樣的意識或領悟。

大語言模型的能力，是由深度學習的進展而解鎖的。

大語言模型透過大量的文本數據訓練，能比傳統方法更好抓住人類語言的脈絡資訊以及微妙之處。

如此，大語言模型顯著改良的大量自然語言處理任務的表現，包含文本翻譯，情感分析，問答。

此外，大語言模型在各種自然語言處理任務都展現出相當的熟練度，是為特定任務設計的傳統自然語言模型無法企及的。

大語言模型的成功歸因於Transformer架構與大量的訓練數據，使其能夠「編碼」各種語言上的微妙，脈絡，以及表達模式。

透過Transfomer架構與大量數據訓練大語言模型的這個趨勢，從根本改變了自然語言處理這個領域。

大語言模型成為了理解人類語言，與人類語言互動的全能工具。

本書的主要目標，是透過程式碼一步一步在Transformer架構上，實踐項ChatGPT一樣的大語言模型，藉此來理解大語言模型。

#大語言模型

#ChatGPT

王啟樺的沙龍LLM 筆記

留言

留言分享你的想法！

普普文創

2024/04/23

有些深奧！

王啟樺

發文者

2024/04/23

普普文創每天學一點！

Dr. Rover

2025/01/28

那請問現在還要花時間去學傳統的分析嗎？如果我只是要應用技術。我用gpt 就可以得到差不多的效果了

王啟樺

發文者

2025/01/28

Dr. Rover 如果有疑慮，先不要學比較對。只學當下自己覺得最值得的就好。

王啟樺的沙龍

589會員

1.9K內容數

Outline as Content

王啟樺的沙龍的其他內容

2024/04/28

LLM 006｜BERT與GPT是怎麼從Transformer演化來的？

在上一期「LLM 005｜大語言模型是如何利用Transformer理解語言的？」我們提到，Transformer是大語言模型理解語言的關鍵。而Transformer架構兩個主要的後代是BERT以及GPT。 BERT是bidirectional encoder representati

2024/04/28

LLM 006｜BERT與GPT是怎麼從Transformer演化來的？

2024/04/27

LLM 005｜大語言模型是如何利用Transformer理解語言的？

現代大語言模型建構於Transformer結構。 Transformer結構是源自於2017年著名論文 Attention Is All You Need的深度神經網路結構。原始的Trasformer是為了機器翻譯發展，當初的任務是將英文翻譯成德文與法文。 Transformer

2024/04/27

LLM 005｜大語言模型是如何利用Transformer理解語言的？

2024/04/26

LLM 004｜創建大語言模型需要哪兩個關鍵階段？

從頭開始寫大語言模型的程式碼，是最好理解大語言模型的機制與限制的方風。從頭開始寫大語言模型的程式碼，可以幫助我們得到預訓練與微調整開源大語言模型架構所需要的知識，並應用到特定領域的數據及以及任務。客製化大語言模型一般來說比起通用大語言模型有更好的表現。一個具體的例子是

2024/04/26

LLM 004｜創建大語言模型需要哪兩個關鍵階段？

看更多

你可能也想看

好好宅在家

設計師也蝦皮購－前陣子為工地買什麼？

家中修繕或裝潢想要找各種小零件時，直接上網採買可以省去不少煩惱～看看Sylvia這回為了工地買了些什麼吧～

#開箱#蝦皮分潤計畫#裝修工程

2025/05/25

好好宅在家

設計師也蝦皮購－前陣子為工地買什麼？

家中修繕或裝潢想要找各種小零件時，直接上網採買可以省去不少煩惱～看看Sylvia這回為了工地買了些什麼吧～

#開箱#蝦皮分潤計畫#裝修工程

2025/05/25

Chloe小窩

我的簡單生活練習：三款包包與日常小物開箱分享

👜簡單生活，從整理包包開始！我的三款愛用包＋隨身小物清單開箱，一起來看看我每天都帶些什麼吧🌿✨

#蝦皮#開箱#蝦皮分潤計畫

2025/06/05

Chloe小窩

我的簡單生活練習：三款包包與日常小物開箱分享

👜簡單生活，從整理包包開始！我的三款愛用包＋隨身小物清單開箱，一起來看看我每天都帶些什麼吧🌿✨

#蝦皮#開箱#蝦皮分潤計畫

2025/06/05

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

創作者營運專員/經理（Operations Specialist/Manager）將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力，找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。

#vocus#方格子#求職

2025/06/23

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

#vocus#方格子#求職

2025/06/23

廣告雜誌

從資料清洗到 RAG，大型語言模型的必需品，做出專屬企業的 AI 知識庫！

在當今快速變化的數位時代，企業面臨著前所未有的數據處理需求。為了應對這些挑戰，企業紛紛建立自己的大型語言模型（LLM），利用大量數據進行訓練，讓模型能夠理解並生成自然語言，從而實現人機協作，優化業務流程並提升客戶體驗。

#廣告雜誌#專欄#cacaFly

2024/07/31

廣告雜誌

從資料清洗到 RAG，大型語言模型的必需品，做出專屬企業的 AI 知識庫！

#廣告雜誌#專欄#cacaFly

2024/07/31

Learn AI 不 BI

AI說書 - Prompt Engineering - 6

我們人類和ChatGPT的對話技巧也是需要學習的，有鑑於此，我想要一天分享一點「和ChatGPT對話的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。針對Generative AI、Foundation Model、Large Language Mode

#AI#ai#PromptEngineering

2024/06/12

Learn AI 不 BI

AI說書 - Prompt Engineering - 6

#AI#ai#PromptEngineering

2024/06/12

生之道 ShengZhiDao

中文系也能和科技產生連接：略分享語言資訊處理的階段發展與趨勢

這篇文章討論了自然語言處理技術的發展歷程，從語言模型的引入到深度學習的應用。作者觀察到現今GPT在產出中文國學內容時的深度不足，並提出了自然語言處理領域的倫理使用和版權問題，以及對大眾的影響。最後，作者探討了個人在自然語言領域的發展可能性。

#語言#資訊#模型

2024/06/05

生之道 ShengZhiDao

中文系也能和科技產生連接：略分享語言資訊處理的階段發展與趨勢

#語言#資訊#模型

2024/06/05

程式輕鬆玩

ChatGPT：人工智慧的對話夥伴

ChatGPT（全名：聊天生成預訓練轉換器）是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出，使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型，並以強化學習進行訓練。

2024/05/15

2024/05/15

筆記-曲博談AI模型.群聯-24.05.05

筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型三個步驟: 1.預訓練，訓練一次要用幾萬顆處理器、訓練時間要1個月，ChatGPT訓練一次的成本為1000萬美金。 2.微調(

2024/05/06

每日發車

筆記-曲博談AI模型.群聯-24.05.05

2024/05/06

iBonnie_愛邦尼

語言模型初探

語言模型與文字表示以不同的方式來分析自然語言的詞語分佈及語意關係。本文章簡要介紹了語言模型、Word2vec、FastText、GloVe和Transformer等技術，並提供了實際的應用參考點，幫助讀者深入理解自然語言處理的技術。

2024/04/17

2024/04/17

這陣子使用AI模型，還有參考國內外一些喜歡玩語言模型的同好發文，一個很有趣的結論就是，有時候把大型語言模型(尤其ChatGPT)當作一個人來溝通，會得到比較好的結果，這的確是非常反直覺的，也就是說很多時候ChatGPT耍懶不肯工作的時候，你用加油打氣，或是情緒勒索的方法，確實是可以得到比較好的結果。

#chatgpt#LLM#AI

2024/03/31