AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

發佈於科技大小事

更新於 2025/02/23發佈於 2024/02/24閱讀時間約 1 分鐘

隨著 ChatGPT 和 Midjourney受到大眾的關注，最近與 AI 相關的名詞變成了 buzzword，前陣子常常看到文章討論深度學習Deep Learning、生成式AI Generative AI，到近期對大型語言模型 LLM、多模態模型 LMM 的討論，接下來將深入討論這兩個模型究竟是什麼？對未來會帶來什麼改變？

大型語言模型（Large Language Models, LLM）
基於深度學習技術的自然語言處理（NLP）模型，模型用於理解、生成、翻譯、總結...等等處理文字語言的任務。這些模型通常訓練於龐大的文本數據集上，以學習語言的結構、語法、語義等層面的知識。目前大型語言模型在日常生活中的應用十分廣泛，如聊天機器人、內容總結、文章改寫或文法修改都是大型語言模型常見得使用場景。
多模態模型（Large Multimodal Models, LMM）
「多模態」指的是多種資料型態，模型能夠處理並整合來自不同資料型態（例如文字、圖像、聲音等）的資訊，用來理解和生成跨模態的內容。多模態模型能夠整合多種數據的能力，幫助其應用在更多元複雜的決策場景，能夠推動醫學、自動駕駛...等等領域的進步。例如醫生結合病歷記錄 (文字)＋心跳血壓(數字)＋掃描圖像(圖片) 多種數據診斷病情，這種複雜的決策場景就很適合使用多模態模型作為輔助。

大型語言模型專注於深入理解和生成自然語言，而多模態模型接受輸入多種資料型態，並致力於跨模態之間的資訊整合和互動。我預測未來將會是多模態模型的天下，如同 ChatGPT 4 不只支援能夠用文字對話，也能夠製作圖片與上傳 Excel 數據檔案製作圖表，支援多種資料型態的多模態模型勢必成為趨勢！

#大語言模型

#多模態模型

#AI人工智慧

Everything ✨科技大小事

留言

留言分享你的想法！

Everything ✨

5會員

17內容數

AI x Data Science 探討 AI 大小事

Everything ✨的其他內容

2024/04/17

AI 深度學習之父 - Geoffrey Hinton 辛頓

1986 年，人工智慧的崛起，神經網路的出現。人工神經網路發展遭遇挑戰，直到 2006 年由Hinton提出限制玻爾茲曼機與深度信念網絡，重新點燃熱情。2018年，Hinton獲得圖靈獎。近年，Hinton持續關注AI帶來的危險，力促人們關注。

2024/04/17

AI 深度學習之父 - Geoffrey Hinton 辛頓

1986 年，人工智慧的崛起，神經網路的出現。人工神經網路發展遭遇挑戰，直到 2006 年由Hinton提出限制玻爾茲曼機與深度信念網絡，重新點燃熱情。2018年，Hinton獲得圖靈獎。近年，Hinton持續關注AI帶來的危險，力促人們關注。

2024/03/28

NVIDIA 成功背後的故事，在挫折中持續堅持，黃仁勳的經營智慧

黃仁勳在史丹佛 View From The Top 的演講，他談到了許多關於 NVIDIA 的故事，創立的初衷、遇到的挑戰、公司轉型的契機等等，也分享了面對困難與未知的挑戰，自己是如何堅持做對的事情，帶領公司持續前進。

2024/03/28

NVIDIA 成功背後的故事，在挫折中持續堅持，黃仁勳的經營智慧

黃仁勳在史丹佛 View From The Top 的演講，他談到了許多關於 NVIDIA 的故事，創立的初衷、遇到的挑戰、公司轉型的契機等等，也分享了面對困難與未知的挑戰，自己是如何堅持做對的事情，帶領公司持續前進。

2024/03/19

世界上第一位 AI 工程師 Devin 誕生，軟體工程師要失業了嗎？

Devin 是世界上首位虛擬 AI 工程師，擁有寫程式、架設網站、除錯、自動化測試等技術。憑藉出色的學習能力，Devin 能夠自動檢查並修正程式碼錯誤，還能自行訓練和微調自身 AI 模型。本文探討了 AI 工程師的能力以及對軟體工程師就業市場的潛在影響。

2024/03/19

世界上第一位 AI 工程師 Devin 誕生，軟體工程師要失業了嗎？

Devin 是世界上首位虛擬 AI 工程師，擁有寫程式、架設網站、除錯、自動化測試等技術。憑藉出色的學習能力，Devin 能夠自動檢查並修正程式碼錯誤，還能自行訓練和微調自身 AI 模型。本文探討了 AI 工程師的能力以及對軟體工程師就業市場的潛在影響。

你可能也想看

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

創作者營運專員/經理（Operations Specialist/Manager）將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力，找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。

#vocus#方格子#求職

2025/06/23

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

創作者營運專員/經理（Operations Specialist/Manager）將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力，找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。

#vocus#方格子#求職

2025/06/23

Learn AI 不 BI

AI說書 - 從0開始 - 86

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 82 到 AI說書 - 從0開始 - 85 的說明，有一個很重要的結論：最適合您的模型不一定是排行榜上最好的模型，您需要學習 NLP 評

#AI#ai#PromptEngineering

2024/07/13

Learn AI 不 BI

AI說書 - 從0開始 - 86

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 82 到 AI說書 - 從0開始 - 85 的說明，有一個很重要的結論：最適合您的模型不一定是排行榜上最好的模型，您需要學習 NLP 評

#AI#ai#PromptEngineering

2024/07/13

Learn AI 不 BI

AI說書 - 從0開始 - 18

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 17中，介紹了大型語言模型 (LLM)世界裡面常用到的Token，現在我們來談談OpenAI的GPT模型如何利用Inference

#AI#ai#PromptEngineering

2024/06/15

Learn AI 不 BI

AI說書 - 從0開始 - 18

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 17中，介紹了大型語言模型 (LLM)世界裡面常用到的Token，現在我們來談談OpenAI的GPT模型如何利用Inference

#AI#ai#PromptEngineering

2024/06/15

朵小芸的草味沙龍

SLM是什麼？探索小型語言模型的未來趨勢

在AI時代中，GPT技術正在改變我們的生活。然而，SLM（小型語言模型）也開始受到關注，具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。

#SLM#LLM#大語言模型

2024/06/06

朵小芸的草味沙龍

SLM是什麼？探索小型語言模型的未來趨勢

在AI時代中，GPT技術正在改變我們的生活。然而，SLM（小型語言模型）也開始受到關注，具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。

#SLM#LLM#大語言模型

2024/06/06

M-Insight：AI科技創新

NEJM AI刊登重磅研究，大型語言模型在腫瘤知識上的效能驗證。

這篇研究探討了不同醫學主題中，大型語言模型對於知識的性能差異，特別是針對腫瘤學領域的幾種主流LLMs進行評估。研究表明，大型語言模型在基礎主題上展示出比臨床腫瘤學更高的準確性，但模型仍具有一定程度的不準確性。研究結果為醫療專業人員和患者更有效地利用LLMs提供了實證支持。

#醫學#GPT-4#臨床試驗

2024/04/28

M-Insight：AI科技創新

NEJM AI刊登重磅研究，大型語言模型在腫瘤知識上的效能驗證。

這篇研究探討了不同醫學主題中，大型語言模型對於知識的性能差異，特別是針對腫瘤學領域的幾種主流LLMs進行評估。研究表明，大型語言模型在基礎主題上展示出比臨床腫瘤學更高的準確性，但模型仍具有一定程度的不準確性。研究結果為醫療專業人員和患者更有效地利用LLMs提供了實證支持。

#醫學#GPT-4#臨床試驗

2024/04/28

Marcos的方格子

大型語言模型常用的提詞框架 | Coursera 課程回顧(下)

大型語言模型（Large Language Model，LLM）是一項人工智慧技術，其目的在於理解和生成人類語言，可將其想像成一種高階的「文字預測機器」，然而，它們並非真正理解語言。除了在上篇介紹的技巧可以協助我們在使用 LLM 時給予指示之外，今天我們會介紹使用 LLM 的框架。

#PromptPattern#LLM#ChatGPT

2024/03/09

Marcos的方格子

大型語言模型常用的提詞框架 | Coursera 課程回顧(下)

大型語言模型（Large Language Model，LLM）是一項人工智慧技術，其目的在於理解和生成人類語言，可將其想像成一種高階的「文字預測機器」，然而，它們並非真正理解語言。除了在上篇介紹的技巧可以協助我們在使用 LLM 時給予指示之外，今天我們會介紹使用 LLM 的框架。

#PromptPattern#LLM#ChatGPT

2024/03/09

AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

大型語言模型(LLM)是基於深度學習的自然語言處理模型，而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言，LMM 能夠處理跨模態的內容，並整合多種資料的能力，有望成為未來趨勢。

#ChatGPT#AI#人工智慧

2024/02/24

AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

大型語言模型(LLM)是基於深度學習的自然語言處理模型，而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言，LMM 能夠處理跨模態的內容，並整合多種資料的能力，有望成為未來趨勢。

#ChatGPT#AI#人工智慧

2024/02/24

Marcos的方格子

大型語言模型常用的 Design Pattern | Coursera 課程回顧(上)

大型語言模型（Large Language Model，LLM）是一項人工智慧技術，其目的在於理解和生成人類語言，可將其想像成一種高階的「文字預測機器」。 Prompt Pattern 是給予LLM的指示，並確保生成的輸出擁有特定的品質（和數量）。

#PromptPattern#LLM#chatgpt

2024/02/13

Marcos的方格子

大型語言模型常用的 Design Pattern | Coursera 課程回顧(上)

大型語言模型（Large Language Model，LLM）是一項人工智慧技術，其目的在於理解和生成人類語言，可將其想像成一種高階的「文字預測機器」。 Prompt Pattern 是給予LLM的指示，並確保生成的輸出擁有特定的品質（和數量）。

#PromptPattern#LLM#chatgpt

2024/02/13

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News