AI說書 - 從0開始 - 381 | Hugging Face T5 模型差異

AI說書 - 從0開始 - 381 | Hugging Face T5 模型差異

更新於 發佈於 閱讀時間約 1 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。


延續 AI說書 - 從0開始 - 380 | Hugging Face 模型組入,會看到諸多 T5 模型種類,當中差異如下:

  • Base 亦即基準模型,它的設計類似於 BERTBASE,有 12 層和大約 2.2 億個參數
  • Small 是一個較小的模型,有 6 層和 6,000 萬個參數
  • Large 的設計與 BERTLARGE 類似,有 12 層、7.7 億個參數
  • 3B 和 11B 使用 24 層編碼器和解碼器,大約有 28 億和 110 億個參數


我們將使用 Large 模型,簡介為:

raw-image


avatar-img
Learn AI 不 BI
219會員
572內容數
這裡將提供: AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹,一起在未來AI的世界擁抱AI技術,不BI。
留言
avatar-img
留言分享你的想法!
Learn AI 不 BI 的其他內容
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 為了後續方面,我們建立一個對話函數,這樣每次只要呼叫該函數即能完成對話: def dialog(uinput): role = "user" line = {"r
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 想要使用 ChatGPT 進行文章總結,首先載入必要依賴: try: import openai from openai import OpenAI exc
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 在進行摘要的過程中,選擇 T5 或 ChatGPT(GPT-4)將始終取決於你實施的項目,Hugging Face 的 T5 模型以其文本到文本的方式提供了許多優勢,而
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 為了後續方面,我們建立一個對話函數,這樣每次只要呼叫該函數即能完成對話: def dialog(uinput): role = "user" line = {"r
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 想要使用 ChatGPT 進行文章總結,首先載入必要依賴: try: import openai from openai import OpenAI exc
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 在進行摘要的過程中,選擇 T5 或 ChatGPT(GPT-4)將始終取決於你實施的項目,Hugging Face 的 T5 模型以其文本到文本的方式提供了許多優勢,而