我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。
在本章中,我們將探討在遵循原始 Transformer 基本結構的同時進行重大變更的創新 Transformer 模型,將會出現許多 Transformer 模型,就像一盒 LEGO 積木提供的無數可能性一樣,你可以用數百種方式組裝這些積木,Transformer 模型的子層和層就是先進 AI 的 LEGO 積木。
我們將探索強大的計算機視覺 Transformer,如 ViT、CLIP、DALL-E 和 GPT-4V,我們可以將 CLIP、DALL-E 和 GPT-4V 添加到 OpenAI ChatGPT、GPT-4、Google PaLM 和 Google BERT(由 Google 訓練)等不斷增長的生成式 AI 基礎模型家族中。
我們將發現這些強大的多模態基礎模型的架構,證明了 Transformer 是任務無關型的,Transformer 學習的是序列,這些序列包括視覺、聲音以及任何類型的數據,只要能夠表示為序列。