AI 模型的進化|從 大型語言模型LLM 到 多模態模型LMM

更新於 發佈於 閱讀時間約 1 分鐘

隨著 ChatGPT 和 Midjourney受到大眾的關注,最近與 AI 相關的名詞變成了 buzzword,前陣子常常看到文章討論深度學習Deep Learning、生成式AI Generative AI,到近期對大型語言模型 LLM、多模態模型 LMM 的討論,接下來將深入討論這兩個模型究竟是什麼?對未來會帶來什麼改變?


  • 大型語言模型(Large Language Models, LLM)
    基於深度學習技術的自然語言處理(NLP)模型,模型用於理解、生成、翻譯、總結...等等處理文字語言的任務。這些模型通常訓練於龐大的文本數據集上,以學習語言的結構、語法、語義等層面的知識。目前大型語言模型在日常生活中的應用十分廣泛,如聊天機器人、內容總結、文章改寫或文法修改都是大型語言模型常見得使用場景。
  • 多模態模型(Large Multimodal Models, LMM)
    「多模態」指的是多種資料型態,模型能夠處理並整合來自不同資料型態(例如文字、圖像、聲音等)的資訊,用來理解和生成跨模態的內容。多模態模型能夠整合多種數據的能力,幫助其應用在更多元複雜的決策場景,能夠推動醫學、自動駕駛...等等領域的進步。例如醫生結合病歷記錄 (文字)+心跳血壓(數字)+掃描圖像(圖片) 多種數據診斷病情,這種複雜的決策場景就很適合使用多模態模型作為輔助。


大型語言模型專注於深入理解和生成自然語言,而多模態模型接受輸入多種資料型態,並致力於跨模態之間的資訊整合和互動。我預測未來將會是多模態模型的天下,如同 ChatGPT 4 不只支援能夠用文字對話,也能夠製作圖片與上傳 Excel 數據檔案製作圖表,支援多種資料型態的多模態模型勢必成為趨勢!


avatar-img
5會員
17內容數
AI x Data Science 探討 AI 大小事
留言
avatar-img
留言分享你的想法!

































































Everything ✨ 的其他內容
Samsung 三星發表第一款 AI 手機 S24 Ultra,介紹了多項 AI 功能,包括 Circle to Search、Live Translate、AI editing、Note Assist 及 Chat Assist。未來AI手機將會越來越普及。
2024 年 2 月,OpenAI 推出了 Sora 文字生成影片模型,該模型根據用戶輸入的文字描述生成逼真的影片,並且能夠控制影片的細節,例如人物、場景、動作、表情等。Sora 的出現無疑為影視創作領域帶來了革命性的變化。
Samsung 三星發表第一款 AI 手機 S24 Ultra,介紹了多項 AI 功能,包括 Circle to Search、Live Translate、AI editing、Note Assist 及 Chat Assist。未來AI手機將會越來越普及。
2024 年 2 月,OpenAI 推出了 Sora 文字生成影片模型,該模型根據用戶輸入的文字描述生成逼真的影片,並且能夠控制影片的細節,例如人物、場景、動作、表情等。Sora 的出現無疑為影視創作領域帶來了革命性的變化。
你可能也想看
Google News 追蹤
Thumbnail
川普2.0的關稅與貿易政策,表面看似反覆無常,實則圍繞著幾個核心目標:扭轉貿易不公、推動美國再工業化、確保戰略自主,以及貫徹「美國優先」原則。本文深入剖析其背後的一致性邏輯、長期戰略意義,以及對全球產業鏈的影響,並探討不同產業的贏家與輸家。
Thumbnail
探討AI眼鏡市場現況、未來趨勢及臺灣供應鏈角色,並涵蓋市場規模、產業趨勢、應用領域、競爭格局及臺灣關鍵企業等面向。
Thumbnail
人類最後的考試(Humanity's Last Exam),這是一個處於人類知識前沿的多模態基準測試,旨在成為同類型中最後一個封閉式學術基準測試,並涵蓋廣泛的學科範圍。該資料集包含來自 100 多個學科的 3,000 道高難度問題。 原文:https://agi.safe.ai/
Thumbnail
研究指出,若在每次迭代中缺乏足量且新鮮的真實資料,生成模型的品質與多樣性都會逐漸退化,最終將陷入所謂的模型自嗜的狀態。
持續改進的力量:如何保持AI模型的競爭力? 💡🚀 隨著AI技術的快速演進,單純構建一個表現優秀的模型已不再是競爭優勢的保證。要在激烈的市場中保持領先,持續改進(Continuous Improvement) 是AI模型生命週期中至關重要的一環。本文將從理論到實踐,系統探討如何有效保持AI模型的
Thumbnail
如果你想要「禁止 AI 模型」爬取您網站的內容進行 AI 訓練 那就可以參考 threads 的 robots.txt 檔案 robots.txt 是一個放在網站根目錄的檔案 大多數的合法爬蟲,都會尊重網站所寫的規定 可以看到,threads 平台禁止了多數 AI 模型的專用
Thumbnail
在當今快速變化的數位時代,企業面臨著前所未有的數據處理需求。為了應對這些挑戰,企業紛紛建立自己的大型語言模型(LLM),利用大量數據進行訓練,讓模型能夠理解並生成自然語言,從而實現人機協作,優化業務流程並提升客戶體驗。
Thumbnail
在AI時代中,GPT技術正在改變我們的生活。然而,SLM(小型語言模型)也開始受到關注,具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。
大語言模型能夠生成文本,因此被認為是生成式人工智慧的一種形式。 人工智慧的學科任務,是製作機器,使其能執行需要人類智慧才能執行的任務,例如理解語言,便是模式,做出決策。 除了大語言模型,人工智慧也包含了深度學習以及機器學習。 機器學習的學科任務,是透過演算法來實踐AI。 特別
大語言模型是一種特殊的神經網路,設計來理解,生成與回應人類的文本。 大語言模型是使用大量文本數據訓練的深度神經網路,其訓練使用的文本數據甚至包括了整個網路公開的文本。 大語言模型的「大」,體現於模型的參數個數以及其使用的訓練數據集。如此大的模型可以有百億甚至千億的參數。這些參數都是神經網
大語言模型,例如OpenAI提供的ChatGPT,是過去幾年發展的深度神經網路模型,開啟自然語言處理的新紀元。
Thumbnail
川普2.0的關稅與貿易政策,表面看似反覆無常,實則圍繞著幾個核心目標:扭轉貿易不公、推動美國再工業化、確保戰略自主,以及貫徹「美國優先」原則。本文深入剖析其背後的一致性邏輯、長期戰略意義,以及對全球產業鏈的影響,並探討不同產業的贏家與輸家。
Thumbnail
探討AI眼鏡市場現況、未來趨勢及臺灣供應鏈角色,並涵蓋市場規模、產業趨勢、應用領域、競爭格局及臺灣關鍵企業等面向。
Thumbnail
人類最後的考試(Humanity's Last Exam),這是一個處於人類知識前沿的多模態基準測試,旨在成為同類型中最後一個封閉式學術基準測試,並涵蓋廣泛的學科範圍。該資料集包含來自 100 多個學科的 3,000 道高難度問題。 原文:https://agi.safe.ai/
Thumbnail
研究指出,若在每次迭代中缺乏足量且新鮮的真實資料,生成模型的品質與多樣性都會逐漸退化,最終將陷入所謂的模型自嗜的狀態。
持續改進的力量:如何保持AI模型的競爭力? 💡🚀 隨著AI技術的快速演進,單純構建一個表現優秀的模型已不再是競爭優勢的保證。要在激烈的市場中保持領先,持續改進(Continuous Improvement) 是AI模型生命週期中至關重要的一環。本文將從理論到實踐,系統探討如何有效保持AI模型的
Thumbnail
如果你想要「禁止 AI 模型」爬取您網站的內容進行 AI 訓練 那就可以參考 threads 的 robots.txt 檔案 robots.txt 是一個放在網站根目錄的檔案 大多數的合法爬蟲,都會尊重網站所寫的規定 可以看到,threads 平台禁止了多數 AI 模型的專用
Thumbnail
在當今快速變化的數位時代,企業面臨著前所未有的數據處理需求。為了應對這些挑戰,企業紛紛建立自己的大型語言模型(LLM),利用大量數據進行訓練,讓模型能夠理解並生成自然語言,從而實現人機協作,優化業務流程並提升客戶體驗。
Thumbnail
在AI時代中,GPT技術正在改變我們的生活。然而,SLM(小型語言模型)也開始受到關注,具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。
大語言模型能夠生成文本,因此被認為是生成式人工智慧的一種形式。 人工智慧的學科任務,是製作機器,使其能執行需要人類智慧才能執行的任務,例如理解語言,便是模式,做出決策。 除了大語言模型,人工智慧也包含了深度學習以及機器學習。 機器學習的學科任務,是透過演算法來實踐AI。 特別
大語言模型是一種特殊的神經網路,設計來理解,生成與回應人類的文本。 大語言模型是使用大量文本數據訓練的深度神經網路,其訓練使用的文本數據甚至包括了整個網路公開的文本。 大語言模型的「大」,體現於模型的參數個數以及其使用的訓練數據集。如此大的模型可以有百億甚至千億的參數。這些參數都是神經網
大語言模型,例如OpenAI提供的ChatGPT,是過去幾年發展的深度神經網路模型,開啟自然語言處理的新紀元。