AI 模型的進化|從 大型語言模型LLM 到 多模態模型LMM

閱讀時間約 1 分鐘

隨著 ChatGPT 和 Midjourney受到大眾的關注,最近與 AI 相關的名詞變成了 buzzword,前陣子常常看到文章討論深度學習Deep Learning、生成式AI Generative AI,到近期對大型語言模型 LLM、多模態模型 LMM 的討論,接下來將深入討論這兩個模型究竟是什麼?對未來會帶來什麼改變?


  • 大型語言模型(Large Language Models, LLM)
    基於深度學習技術的自然語言處理(NLP)模型,模型用於理解、生成、翻譯、總結...等等處理文字語言的任務。這些模型通常訓練於龐大的文本數據集上,以學習語言的結構、語法、語義等層面的知識。目前大型語言模型在日常生活中的應用十分廣泛,如聊天機器人、內容總結、文章改寫或文法修改都是大型語言模型常見得使用場景。
  • 多模態模型(Large Multimodal Models, LMM)
    「多模態」指的是多種資料型態,模型能夠處理並整合來自不同資料型態(例如文字、圖像、聲音等)的資訊,用來理解和生成跨模態的內容。多模態模型能夠整合多種數據的能力,幫助其應用在更多元複雜的決策場景,能夠推動醫學、自動駕駛...等等領域的進步。例如醫生結合病歷記錄 (文字)+心跳血壓(數字)+掃描圖像(圖片) 多種數據診斷病情,這種複雜的決策場景就很適合使用多模態模型作為輔助。


大型語言模型專注於深入理解和生成自然語言,而多模態模型接受輸入多種資料型態,並致力於跨模態之間的資訊整合和互動。我預測未來將會是多模態模型的天下,如同 ChatGPT 4 不只支援能夠用文字對話,也能夠製作圖片與上傳 Excel 數據檔案製作圖表,支援多種資料型態的多模態模型勢必成為趨勢!


5會員
17內容數
AI x Data Science 探討 AI 大小事
留言0
查看全部
發表第一個留言支持創作者!
Everything ✨ 的其他內容
Samsung 三星發表第一款 AI 手機 S24 Ultra,介紹了多項 AI 功能,包括 Circle to Search、Live Translate、AI editing、Note Assist 及 Chat Assist。未來AI手機將會越來越普及。
2024 年 2 月,OpenAI 推出了 Sora 文字生成影片模型,該模型根據用戶輸入的文字描述生成逼真的影片,並且能夠控制影片的細節,例如人物、場景、動作、表情等。Sora 的出現無疑為影視創作領域帶來了革命性的變化。
Samsung 三星發表第一款 AI 手機 S24 Ultra,介紹了多項 AI 功能,包括 Circle to Search、Live Translate、AI editing、Note Assist 及 Chat Assist。未來AI手機將會越來越普及。
2024 年 2 月,OpenAI 推出了 Sora 文字生成影片模型,該模型根據用戶輸入的文字描述生成逼真的影片,並且能夠控制影片的細節,例如人物、場景、動作、表情等。Sora 的出現無疑為影視創作領域帶來了革命性的變化。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
本篇文章主要介紹一位菲律賓學者對使用大型語言模型產生文章的想法,說明如何利用AI技術進行學術寫作,以及提示工程的重要性。文中介紹了許多在醫學領域的應用以及學術寫作中的多種提示類型。文章還提到了。本文將會給讀者帶來對AI在學術寫作領域的啟發。
Thumbnail
前言 在AI經歷數個冰河期後,終於在後疫情時代來到了一個技術高峰,而這個破冰者就是OPen AI(ChatGPT),對於這個話題不管你是是正在接觸AI,對AI技術有些了解的人,抑或是專業領域上對於AI介入感到焦慮的人都希望可以文中得到收穫。 本文想分享一些個人對於AI的理解及對於LLM模型的一些
Thumbnail
OpenAI最新推出的「Sora」是一款文本生成影像的AI模型,只要輸入幾句簡單的文字描述,就能自動生成出影像,影片內容可以包含多名角色,搭配特定的動態場景,且影片長度最高可達60秒,同時還能展示複雜的攝影機運動。Sora還能夠根據靜態圖片來製作動畫,功能十分強大。目前Sora還沒有開放給大眾使
Thumbnail
本文通過詳細評比四個AI圖像生成模型,提供了這些平臺在十個不同領域的影像生成效能和優缺點的關鍵資訊。評估基於OpenGPT.com上OpenDraw服務,採用了DALL·E 3、Google Imagen2、Stable Diffusion以及Midjourney的預設配置進行。
Thumbnail
上禮拜Google 發布了新的AI模型Gemini, 號稱可以打敗ChatGPT 這一年來關於AI的八卦真的很精彩XD 我滿喜歡這篇新聞 用了很多生動的用詞來描繪這個AI模型將對Google的產品服務產生的影響 字裡行間可以感覺Google對自己很有信心呢~ 底下就來邊看我分享邊學起來囉!
Thumbnail
近年來,對話式AI取得了顯著的進展,而ChatGPT正處於這場革命的前沿。ChatGPT由OpenAI開發,它是一種基於先進語言模型的AI,利用深度學習技術進行互動和類人對話。在本文中,我們將深入探討ChatGPT的能力、應用、影響以及對各個行業和領域的影響,展示它在改變我們與AI互動方式方面的潛
Thumbnail
2023年被各大主流媒體稱為AI元年,GPT4 在國際生物奧林匹亞競賽大放異彩,擊敗 99% 的資優生,無人可敵。擁有人工技術,等於擁有世界頂尖員工,24小時不停歇,為你不斷生出結果。然而,多數人對 AI 基本知識仍不明白,知識差距急速擴大,要想不被AI取代,必須懂AI與活用AI。
Thumbnail
希望提升低批准率跟低準確性的信用評估,但投入資源後卻仍無法建立有效準確的信用模型,此時如果能有個快速上手跟安裝的信用模型就會很重要。看見公司在信用風險評估上的難處,finbots.ai 抓住商機,在 2020 年成立公司,主打信用評估產品CreditX,協助公司建立準確的信用模型。
Thumbnail
本文探討了大型語言模型中的特殊現象,包括頓悟現象,大模型的隱藏知識引導,以及模型越大對某些問題的理解越偏離的U型曲線。文章強調,當模型不夠理想時,我們需要更好地引導模型或了解問題的本質,而非只是增加模型的大小。
Thumbnail
前言 前陣子看到臉書與PTT有人分享台北有財神廟推出可以幫你用AI人工智慧預測未來股價的APP,在留言區造成很多網友的迴響,連我也覺得十分酷炫。(但有網友質疑APP程式來源的真偽性,我在 GOOGLE地圖上也查不到台北有這間廟,不建議大家下載使用) 其實AI人工智慧投資早已不是新聞,在國外早有許多
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
本篇文章主要介紹一位菲律賓學者對使用大型語言模型產生文章的想法,說明如何利用AI技術進行學術寫作,以及提示工程的重要性。文中介紹了許多在醫學領域的應用以及學術寫作中的多種提示類型。文章還提到了。本文將會給讀者帶來對AI在學術寫作領域的啟發。
Thumbnail
前言 在AI經歷數個冰河期後,終於在後疫情時代來到了一個技術高峰,而這個破冰者就是OPen AI(ChatGPT),對於這個話題不管你是是正在接觸AI,對AI技術有些了解的人,抑或是專業領域上對於AI介入感到焦慮的人都希望可以文中得到收穫。 本文想分享一些個人對於AI的理解及對於LLM模型的一些
Thumbnail
OpenAI最新推出的「Sora」是一款文本生成影像的AI模型,只要輸入幾句簡單的文字描述,就能自動生成出影像,影片內容可以包含多名角色,搭配特定的動態場景,且影片長度最高可達60秒,同時還能展示複雜的攝影機運動。Sora還能夠根據靜態圖片來製作動畫,功能十分強大。目前Sora還沒有開放給大眾使
Thumbnail
本文通過詳細評比四個AI圖像生成模型,提供了這些平臺在十個不同領域的影像生成效能和優缺點的關鍵資訊。評估基於OpenGPT.com上OpenDraw服務,採用了DALL·E 3、Google Imagen2、Stable Diffusion以及Midjourney的預設配置進行。
Thumbnail
上禮拜Google 發布了新的AI模型Gemini, 號稱可以打敗ChatGPT 這一年來關於AI的八卦真的很精彩XD 我滿喜歡這篇新聞 用了很多生動的用詞來描繪這個AI模型將對Google的產品服務產生的影響 字裡行間可以感覺Google對自己很有信心呢~ 底下就來邊看我分享邊學起來囉!
Thumbnail
近年來,對話式AI取得了顯著的進展,而ChatGPT正處於這場革命的前沿。ChatGPT由OpenAI開發,它是一種基於先進語言模型的AI,利用深度學習技術進行互動和類人對話。在本文中,我們將深入探討ChatGPT的能力、應用、影響以及對各個行業和領域的影響,展示它在改變我們與AI互動方式方面的潛
Thumbnail
2023年被各大主流媒體稱為AI元年,GPT4 在國際生物奧林匹亞競賽大放異彩,擊敗 99% 的資優生,無人可敵。擁有人工技術,等於擁有世界頂尖員工,24小時不停歇,為你不斷生出結果。然而,多數人對 AI 基本知識仍不明白,知識差距急速擴大,要想不被AI取代,必須懂AI與活用AI。
Thumbnail
希望提升低批准率跟低準確性的信用評估,但投入資源後卻仍無法建立有效準確的信用模型,此時如果能有個快速上手跟安裝的信用模型就會很重要。看見公司在信用風險評估上的難處,finbots.ai 抓住商機,在 2020 年成立公司,主打信用評估產品CreditX,協助公司建立準確的信用模型。
Thumbnail
本文探討了大型語言模型中的特殊現象,包括頓悟現象,大模型的隱藏知識引導,以及模型越大對某些問題的理解越偏離的U型曲線。文章強調,當模型不夠理想時,我們需要更好地引導模型或了解問題的本質,而非只是增加模型的大小。
Thumbnail
前言 前陣子看到臉書與PTT有人分享台北有財神廟推出可以幫你用AI人工智慧預測未來股價的APP,在留言區造成很多網友的迴響,連我也覺得十分酷炫。(但有網友質疑APP程式來源的真偽性,我在 GOOGLE地圖上也查不到台北有這間廟,不建議大家下載使用) 其實AI人工智慧投資早已不是新聞,在國外早有許多