拐點 #002: 大語言模型的基本原理與工作方式

Item: 拐點
Rating: 5
Author: Will Shen

Will Shen

發佈於拐點

更新於 2024/05/20發佈於 2024/05/11閱讀時間約 4 分鐘

演進歷程：從規則驅動到機器學習

在人工智能的發展歷程中，早期的研究主要側重於將解決問題的規則輸入計算機，試圖通過啟蒙運動理性的思路模擬人類的智能行為。然而，這條路逐漸變得艱難，因為規則過於繁多，無法應對複雜的情境和語境。在這個背景下，一些科學家轉向了神經網絡算法，試圖模擬人腦的感知能力。這種新的方法不再依賴於預先設定的規則，而是讓機器自己學習規律和模式，GPT便是這種方法的產物。

大語言模型(Large Language Model, LLM)是基於深度學習(deep learning)的人工智能模型，其核心原理是神經網絡。神經網絡模擬了人類神經系統的結構，由多個神經元組成的層次結構。

訓練過程：從數據中學習規律

大語言模型的訓練過程包括兩個關鍵階段：訓練和推理。

在訓練階段，模型通過大量的文本數據進行學習，不斷調整其參數以優化模型性能。這個過程需要大量的計算資源和數據支持，以確保模型能夠準確理解和生成文本。一旦訓練完成，模型的參數將固定下來，可以用於後續的推理過程。

參數設定是在大語言模型的訓練過程中發生的。在訓練過程中，模型的參數需要初始化為某些值，然後透過反向傳播算法不斷地更新和調整這些參數，以使模型的預測結果與實際結果之間的誤差最小化。

我們用人類如何學習寫作技能類比這個訓練過程。

首先是"初學階段：掌握基本技能"。當我們初次學習寫作時，首先需要掌握基本的語法、拼寫和標點等技能。這與LLM的初始訓練階段相似，模型通過大量的數據學習語言的基本規則和結構，建立對語言的基本理解。

再來是"實踐中的提升：模仿與練習"。在寫作過程中，我們通過模仿優秀作品、大量練習和反饋來提升自己的寫作水平。這就像LLM在訓練過程中不斷接觸和學習大量的文本數據，逐漸領悟語言的內在規律和模式。

接著是"反饋與調整：修正錯誤、改進進程"。我們會接受來自老師、同學或編輯的反饋，不斷修正錯誤、改進寫作進程。類似地，LLM在訓練過程中也會根據數據的反饋不斷調整模型參數，提升模型的性能和準確性。

推理過程：自主生成文本

其目的是根據輸入內容生成相關的文本輸出。在推理過程中，模型利用其固定的參數和訓練經驗來預測下一個詞語或句子，並生成連貫的文本。推理過程是大語言模型應用於實際場景的關鍵步驟，如文本生成、對話系統等。

在寫作的推理過程中，我們常常依靠自己的靈感和想象力來創作新的作品。類似地，LLM在推理過程中會根據已有的知識和模式，自主生成文本，如文本生成、對話系統等。有時候，我們會結合先驗知識和已有模式，進行模仿創作，同時也能夠進行創新，生成全新的內容。LLM在推理過程中也會結合已有的數據和模式，生成新穎、連貫的文本，不斷拓展其應用領域。

結論

具體來說，GPT-3.5擁有超過1000億個參數，模型的參數是用來調整和控制模型行為的變量，其數量直接影響到模型的複雜度和性能。這些參數通常是模型中神經元之間的權重值、偏差值等。「1000億個參數」表示這個大語言模型中包含了1000億個用來調整模型行為的變量，這是一個非常龐大的數量，需要極大的計算能力和數據量來進行訓練和推理。

之後的版本GPT-4以及未來的GPT-5等將擁有更多的參數。這些參數的增加意味著模型能夠處理更多的數據和更複雜的任務，但同時也意味著需要更大的計算資源來訓練和推理這些模型。因此，這也提醒人們意識到，發展AI模型需要巨大的計算資源，而這也可能成為未來發展的一個挑戰。

發展AI模型需要會面臨以下挑戰：

計算成本：大型AI模型需要龐大的計算資源進行訓練和推理，這導致了龐大的計算成本。這包括硬體設備的購買和維護成本，以及雲端計算服務的使用費用。
能源消耗：大量的計算資源需要大量的能源來運行，這對能源供應和環境造成了壓力。高能耗也導致了對可再生能源的需求增加。
計算資源分配不均：許多開發中國家或地區缺乏充足的計算資源，這導致了在全球範圍內計算資源的分配不均，進一步加劇了數字鴻溝。
技術限制：隨著模型規模的不斷增長，需要更多先進的計算技術來支持大型模型的訓練和推理。這包括高性能計算、分佈式計算、量子計算等技術。
數據需求：大型AI模型需要大量的數據進行訓練，這對數據的收集、清理和標註提出了更高的要求。同時，大型模型也可能會對隱私和數據安全構成挑戰。

這需要政府、企業和學術界的共同努力，以確保計算資源的可持續利用和公平分配。

內容總結

拐點

Will 進步本拐點

Will 進步本

5會員

240內容數

歡迎來到「Will 進步本」！我們將探索計算機科學、商用英文和生成式AI。從基礎到前沿，共同學習和交流，拓展知識視野，啟發創新思維

留言

留言分享你的想法！

Will 進步本的其他內容

拐點 #001: AI的思路不像人

我們對AI的認識往往停留在其自動執行任務和模仿人類思維的層面上。但深入探索後，發現AI真正的價值和獨特之處在於其他方面。

5/5拐點

#拐點 #閱讀心得

拐點: 人要比AI兇

人要比AI兇

拐點 #001: AI的思路不像人

我們對AI的認識往往停留在其自動執行任務和模仿人類思維的層面上。但深入探索後，發現AI真正的價值和獨特之處在於其他方面。

5/5拐點

#拐點 #閱讀心得

拐點: 人要比AI兇

人要比AI兇

你可能也想看

該來的終究還是來了度過焦躁不安的一整周，學徒老人家我的不安感等比級數的襲來，自3/19寫了第一篇關於<巴克萊銀行：倉促撤退>的報告，看到市場上的機構法人有如大洪水、地震來臨前夕開始竄逃撤退。海湖莊園協議接著，在3/31與4/2兩天接著寫了川普與他的財經團隊在海湖莊園豪

#危機 #川普 #金融海嘯

MimiVsJames的美股投資分享

2025/04/08

本週關稅與CPI 將至：美股進入反彈或持續下跌的臨界點

空單爆天量、技術指標超賣、情緒恐慌到極致：美股嘎空行情有機會啟動嗎？重點摘要：技術面極度超賣，反彈條件醞釀中，但尚未明確止穩 SPY 與 QQQ 的重要指標，如MACD、KDJ、RSI等指標進入極端超賣區，但尚未出現底部鈍化或明確反轉訊號，技術面仍屬空方主導。連續出現跳空缺口，空方動

#美股 #美股投資 #風險

方格子 vocus 官方沙龍

2025/03/24

「方格人氣王」挑戰賽🏆！發文互動拿禮物，登上首頁曝光！

全新 vocus 挑戰活動「方格人氣王」來啦～四大挑戰任你選，留言 / 愛心 / 瀏覽數大 PK，還有新手專屬挑戰！無論你是 vocus 上活躍創作者或剛加入的新手，都有機會被更多人看見，獲得站上版位曝光＆豐富獎勵！🏆

#方格人氣王 #方格留言王 #方格愛心王

烏托邦邦的沙龍

2024/08/06

『人工智能』AI的崛起早已對人類產生威脅？！

人工智能:革命性技術的崛起與挑戰 1. 什麼是人工智能? 人工智能(AI)是指由人類創造的機器或系統,能夠模仿人類智能,執行通常需要人類智能才能完成的任務。這包括學習、問題解決、語言理解、視覺感知等能力。AI系統可以處理大量數據,識別模式,並根據這些信息做出決策或預測。 2.

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習 #人工智慧 #數據

普普文創

2024/07/30

【文創漫談】人工智慧與機器學習 | 如何利用AI | 增強能力

人工智慧是什麼？人工智慧（Artificial Intelligence, AI）簡單來說，就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序，可以執行許多原本需要人類智慧才能完成的工作，例如：語音辨識：讓電腦聽懂人類的語言，像是 Siri、Google As

#文創漫談 #人工智慧與機器學習 #如何利用AI

AI的世界充滿了創新和潛力，涵蓋了許多領域，包括但不限於機器學習，自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的，既帶來了巨大的機遇，也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡，確保AI技術的應用能夠真正造福人類。

人工智慧系統正在慢慢影響我們的生活，並在不同的產業和產品中得到應用。目前使用的系統大多是基於狹義人工智慧。狹義人工智慧與通用人工智慧有很大不同。狹義人工智慧的創建是為了專注於特定任務，一個例子就是聊天機器人。

#AI #科技 #人工智慧

王啟樺的沙龍

2024/04/25

LLM 003｜人工智慧如何從數據中學習？

大語言模型能夠生成文本，因此被認為是生成式人工智慧的一種形式。人工智慧的學科任務，是製作機器，使其能執行需要人類智慧才能執行的任務，例如理解語言，便是模式，做出決策。除了大語言模型，人工智慧也包含了深度學習以及機器學習。機器學習的學科任務，是透過演算法來實踐AI。特別

#大語言模型 #ChatGPT #人工智慧

唐志偉的沙龍

2024/04/19

人工智慧：從起源到數位轉型的必備工具

在當今數位化的時代，人工智慧已然成為企業界的一個焦點。這種技術的應用不僅僅是技術上的進步，更是一種商業策略的轉型。然而，要了解人工智慧的意義和影響，我們需要回顧其起源。

美國人力資源港 - 九思觀點

2024/02/23

何謂「人工智能」？What is AI?

AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域，包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性，還可解決複雜的問題和挑戰。

#人工智能 #機器學習 #深度學習

王啟樺的沙龍

2024/01/15