開發動機:

AI說書 - 從0開始 - 128 | Transformer 和 BERT 模型參數比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在 AI說書 - 從0開始 - 127 中提及： Transformer 的關鍵參數為：原始 Transformer 模型中，左圖的 N = 6 原始 Tran

2024/08/12

AI說書 - 從0開始 - 128 | Transformer 和 BERT 模型參數比較

2024/08/12

AI說書 - 從0開始 - 39

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。首先先展示 Transformer 的架構圖：可以看到架構中不再出現 RNN 、 LSTM 、 CNN 等物件，因為 Recurrence 已被摒棄。

2024/06/22

AI說書 - 從0開始 - 39

AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

2024/06/22

朵小芸的草味沙龍

SLM是什麼？探索小型語言模型的未來趨勢

在AI時代中，GPT技術正在改變我們的生活。然而，SLM（小型語言模型）也開始受到關注，具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。

2024/06/06

2024/06/06

大型語言模型(LLM)是基於深度學習的自然語言處理模型，而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言，LMM 能夠處理跨模態的內容，並整合多種資料的能力，有望成為未來趨勢。

#ChatGPT#AI#人工智慧

2024/02/24

Everything ✨

AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

#ChatGPT#AI#人工智慧

2024/02/24

#對抗生成模型#對抗生成蒸餾#StabilityAI

對抗擴散生成蒸餾(ADD) 讓生成模型快又有效

Stability AI在圖片/影片/聲音生成領域貢獻了不少心力，近期提出了更加高效率的對抗生成蒸餾方法，只需進行一步計算，便能打敗LCM需要4步計算的結果，來看看具體是如何做到的。

2023/12/20

#對抗生成模型#對抗生成蒸餾#StabilityAI

對抗擴散生成蒸餾(ADD) 讓生成模型快又有效

2023/12/20

Karen的沙龍

LLM 串連：利用不同模型的優勢完成更複雜和多樣的任務

前言在先前的文章中，我們探討了 IBM Watsonx 在客戶滿意度分析中的應用。今天，我們將利用 Google 的兩款大型語言模型（LLM）— flan-ul2 和 flan-t5-xxl，展示它們如何串聯起來生成關於特定主題的隨機問題和回答。在這篇文章中，將使用 SimpleSequen

#模型#LLM#IBM

2023/12/18

Karen的沙龍

LLM 串連：利用不同模型的優勢完成更複雜和多樣的任務

#模型#LLM#IBM

2023/12/18

需時間驗證的Transformer挑戰者，Mamba (Albert Gu & Tri Dao)

本篇文章為大家導讀近日火熱的Mamba Paper，新聞標題說它是Transformer的繼任者，是否真是如此? 讓我們一起一探究竟，本文著重介紹論文前半部分。

#Mamba#FlashAttention#SSMs

2023/12/12

需時間驗證的Transformer挑戰者，Mamba (Albert Gu & Tri Dao)

本篇文章為大家導讀近日火熱的Mamba Paper，新聞標題說它是Transformer的繼任者，是否真是如此? 讓我們一起一探究竟，本文著重介紹論文前半部分。

#Mamba#FlashAttention#SSMs

2023/12/12

你風哥的 AI 分享好讀版

「快，還能更快？」讓AI四步成畫的LCM

今天我們來看一個最近討論度非常高的AI繪圖新技術，一個讓你可以在幾秒鐘內看到成品，不論是訓練還是生成都大大降低了資源成本的技術。※影片中有誤的地方補充在CC字幕，本篇內容也已修正。

#LCM#AI繪圖#StableDiffusion

2023/12/05

你風哥的 AI 分享好讀版

「快，還能更快？」讓AI四步成畫的LCM

#LCM#AI繪圖#StableDiffusion

2023/12/05

即時生圖應用大行其道，LCM手法理解與未來應用

北京清華大學改進了傳統Stable Diffusion (SD) 文生圖的加速算法，讓SD這項技術，可以在筆電達到即時(Real Time)運算等級，讓我們一起來了解這項技術，期許未來能在各種應用上使用，或是看到源碼也不陌生。

#LCM#北京清華大學#文字生圖片

2023/11/26