在AWS部署多大型多語言語言模型BLOOM

閱讀時間約 9 分鐘
大型語言模型(Large Language Model, LLM)是當前AI/ML的熱門領域,短時間內在自然語言處理和文本生成等領域的應用上有顯著突破。兩年內,隨著深度學習和硬體的發展,大型語言模型取得了顯著進展,並在語言處理相關領域帶來革命性影響。
大型語言模型的潮流可以追溯到開源模型如Transformer, GPT(Generative Pre-trained Transformer)和BERT(Bidirectional Encoder Representations from Transformers)的出現。這些模型利用深度神經網絡和注意力機制等技術,通過大規模的無監督預訓練來學習語言的統計特徵和語義關聯性。這些預訓練模型可以針對不同情境進行微調,以適應特定的任務,如文本分類、命名實體識別和情感分析等。

大型語言模型的應用情境非常廣泛。它們可以用於自然語言理解和生成任務,如機器翻譯、文本摘要、對話系統和問答系統等。並可以應用於文本生成,如自動寫作、劇本生成和詩歌創作等進階任務。大型語言模型在資訊檢索、推薦系統和知識圖譜構建等領域也有顯著進展。

本文將介紹在AWS SageMaker上部署及應用多語言大型語言模型BLOOM模型:bloom-176B的方法。

多語言大型語言模型BLOOM(bloom-176B)


BLOOM是一個預訓練的大型語言模型,基於Decoder-only Transformer架構。該模型架構類似於GP3(175B參數),並且經過優化以用於文本生成。作為語言模型,BLOOM基本原理便是利用輸入的前文來預測下一個詞,並且往復進行,直至產生完整文句。作為BLOOM系列的其中一個預訓練模型,bloom-176B使用如下模型架構及目標函數:
Model Architecture and Objective
Modified from Megatron-LM GPT2
Decoder-only architecture
Layer normalization applied to word embeddings layer (StableEmbedding)
ALiBI positional encodings, with GeLU activation functions

176,247,271,424 parameters:
3,596,615,680 embedding parameters
70 layers, 112 attention heads
Hidden layers are 14336-dimensional
Sequence length of 2048 tokens used (see BLOOM tokenizer, tokenizer description)
Objective Function: Cross Entropy with mean reduction.

於AWS部署Bloom-176B

部署系統需求

  1. AWS 帳戶。
  2. 加入 Amazon SageMaker Studio。(通常需要花費 10 分鐘左右執行初始設定)
  3. 對於 BLOOM-176B,建議使用 ml.p4d.24xlarge。

使用Amazon SageMaker

Bloom-176是可用的最大Bloom模型。我們可以使用SageMaker Deep Learning Container (DLC) 來部署模型。

萾於模型的大小,模型部署我們需要使用較大型的虛擬機型。藉由AWS SageMaker對分散式運算支援的便利性,將模型層和參數分散到多個GPU。在本文的操作中,我們使用DeepSpeed進行張量(Tensor)運算的平行化。

按照以下步驟來部署Bloom-176,利用現有的AWS Jupyter筆記本:
  1. 在選擇的AWS區域中打開Amazon SageMaker Studio。在選擇AWS區域時,請考慮可用的機型。此模型需要使用ml.p4d.24xlarge。
  2. 在Amazon SageMaker Studio中,複製amazon-sagemaker-examples。
  3. 到路徑inference/nlp/realtime/llm/bloom_176b/,並打開notebook “djl_deepspeed_deploy.ipynb”。
  4. 執行筆記本中的所有cell,只需注意最後5個單元格將進行資源清理,可以在結束使用前執行即可,並且注意notebook中的兩個可設置選項:
  • 指定從Hugging Face Hub下載模型
此筆記本默認將重複使用從Hugging Face下載的位於Amazon S3存儲桶“sagemaker-sample-files”中的Bloom模型。但是,如果希望從Hugging Face下載模型並將其存儲在您自己的Amazon S3存儲桶中,可以將變量install_model_locally設置為True。
  • 使用VpcConfig指定創建端點
如果您想要為模型端點指定VpcConfig,則可以使用此部分。出於安全原因,建議將AWS資源保持在您自己的VPC中運行。如果選擇使用VpcConfig,您需要執行此部分中的可選單元格,並un-comment“在創建endpoint的步驟中的: VpcConfig=privateVpcConfig。

BLOOM模型應用

創建endpoint後,可以使用notebook中的 “Leverage the Boto3 to invoke the endpoint”。如以下範例:

Query:
%%time

smr_client.invoke_endpoint(
EndpointName=endpoint_name,
Body=json.dumps(
{
"input": [
        "Cloud computing advances", 
        "AWS is the best" 
        ],
"gen_kwargs": {
"min_length": 20,
"max_new_tokens": 100,
"temperature": 0.8,
"num_beams": 5,
"no_repeat_ngram_size": 2,
},
}
),
ContentType="application/json",
)["Body"].read().decode("utf8")
Response:
CPU times: user 18.6 ms, sys: 0 ns, total: 18.6 ms
Wall time: 11.8 s

'[\n "Cloud computing advances in the last few years have made
 it possible to store and process large amounts of data in a 
cost-effective manner. Cloud computing is a model for enabling
 ubiquitous, convenient, on-demand network access to a shared 
pool of configurable computing resources (e.g., networks, 
servers, storage, applications, and services) that can be 
rapidly provisioned and released with minimal management 
effort or service provider interaction. This cloud model 
promotes availability and is composed of five essential 
characteristics, three service models",\n  "AWS is the best
 cloud computing service provider in the world. It provides a
 wide range of services to its customers. The services provided
 by the company are as follows:\\nThe company has a large number 
of data centers in different parts of the globe. This is done to
 ensure that the services are available to the customers at all 
times."\n]'

    1會員
    1內容數
    留言0
    查看全部
    發表第一個留言支持創作者!
    你可能也想看
    Google News 追蹤
    Thumbnail
    這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
    Thumbnail
    美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
    Thumbnail
    Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
    Thumbnail
    Amazon 公布Q2業績,營收年增7%至1212億,優於預期的1190億。EPS $-0.2,低於預期的0.12,但主要來自於Rivian股價崩跌的虧損減記39億,比較無法相比。 通膨與升息帶來的經濟衰退荷包消費縮減疑慮,在所有零售板塊都無法倖免於難,最大的電商Amazon自然也是同樣的道理。
    Thumbnail
    如果要用一句話來說的話,那應該是『技術有限,價值無限』
    你   我 遊走 四月是最殘酷月份 我說聽我(Hello?) 穿透了我的是你的凝視(”Goodbye!”) 不曾存在 此刻之前的 轉身之後了
    Thumbnail
    有人說,努力是一切之源。 努力就可以靠近自己的夢想。 現實展示在我們面前的卻是: 長得好看的人,比努力的人更容易被發掘和獲得機會。 長得好看的人,更容易得到大家的青睞和愛戴。 努力和樣貌,哪一個才該是世界的主流呢? 工作了那麼多年, 今時今日,我依舊沒辦法給這個問題一個答案。
    Thumbnail
    當下無法分辨那股情緒是否來自於所有壓力終於釋放了,但我想是一路上那些努力給予幫助的人讓我在這繁忙的大城市裡感受到『人間自有真情在』。我在心裡向那些人深深一鞠躬,並且給那個陪著我們奔跑的阿姨一個緊緊的擁抱。
    Thumbnail
    一個人一輩子可能都會有些刻骨銘心的什麼。對我來講,《燃燒女子的畫像》是一部真正懂我的電影。 前面說這麼多廢話是為了當作防雷線。沒看過本電影不要進來。下面要開始了,妳可以選擇離開,如果不想被爆雷。進來了就一起燃燒吧! 年齡限制:法國普級,德國12+,台灣15+
    Thumbnail
    資料科學家、數據分析師是近幾年新興,而且熱門的職業,而DataCamp是一個專精於資料科學的程式教學網站。在實務上會用到的各種知識與程式技能,從流程面的網路爬蟲、數據清洗、資料視覺化,到技術面的Python、R語言、SQL,在DataCamp上幾乎都可以找到相關教學。
    Thumbnail
    在前篇〈人才的成本:微軟在台灣設立研發中心的真正原因〉一文中,作者說明了台灣被微軟等大公司選中、設立研發中心的主要原因;本文則繼續從企業與產品發展的角度,討論企業研發中心遭遇的問題、現況、轉型求生的方式、以及對人才的要求,帶您一窺新聞背後的種種考量。
    Thumbnail
    先說結論,以我從學生時代開始的觀察,在日本語言交換的市場裡: 英文>日文>韓文>中文; 女生比男生受歡迎。而學中文的日本人以男性居多(工作需要?),學韓文的日本人以女性居多(文化的影響?)。這次來日本作了兩次語言交換: 1. 台日語言交換: 日:台 = 1:3; 男:女 = 3:1 人數 12 人。
    Thumbnail
    <p>作者之所以將自己的目光鎖定這數以億計在貧窮裡掙扎的窮人,是要大家不要遺忘還有人在苦難中,報導這些無法爬上載滿機會的火車的人們。即便他們雖然處在無法翻身的境地,仍然充滿了勇氣與尊嚴。</p>
    Thumbnail
    這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
    Thumbnail
    美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
    Thumbnail
    Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
    Thumbnail
    Amazon 公布Q2業績,營收年增7%至1212億,優於預期的1190億。EPS $-0.2,低於預期的0.12,但主要來自於Rivian股價崩跌的虧損減記39億,比較無法相比。 通膨與升息帶來的經濟衰退荷包消費縮減疑慮,在所有零售板塊都無法倖免於難,最大的電商Amazon自然也是同樣的道理。
    Thumbnail
    如果要用一句話來說的話,那應該是『技術有限,價值無限』
    你   我 遊走 四月是最殘酷月份 我說聽我(Hello?) 穿透了我的是你的凝視(”Goodbye!”) 不曾存在 此刻之前的 轉身之後了
    Thumbnail
    有人說,努力是一切之源。 努力就可以靠近自己的夢想。 現實展示在我們面前的卻是: 長得好看的人,比努力的人更容易被發掘和獲得機會。 長得好看的人,更容易得到大家的青睞和愛戴。 努力和樣貌,哪一個才該是世界的主流呢? 工作了那麼多年, 今時今日,我依舊沒辦法給這個問題一個答案。
    Thumbnail
    當下無法分辨那股情緒是否來自於所有壓力終於釋放了,但我想是一路上那些努力給予幫助的人讓我在這繁忙的大城市裡感受到『人間自有真情在』。我在心裡向那些人深深一鞠躬,並且給那個陪著我們奔跑的阿姨一個緊緊的擁抱。
    Thumbnail
    一個人一輩子可能都會有些刻骨銘心的什麼。對我來講,《燃燒女子的畫像》是一部真正懂我的電影。 前面說這麼多廢話是為了當作防雷線。沒看過本電影不要進來。下面要開始了,妳可以選擇離開,如果不想被爆雷。進來了就一起燃燒吧! 年齡限制:法國普級,德國12+,台灣15+
    Thumbnail
    資料科學家、數據分析師是近幾年新興,而且熱門的職業,而DataCamp是一個專精於資料科學的程式教學網站。在實務上會用到的各種知識與程式技能,從流程面的網路爬蟲、數據清洗、資料視覺化,到技術面的Python、R語言、SQL,在DataCamp上幾乎都可以找到相關教學。
    Thumbnail
    在前篇〈人才的成本:微軟在台灣設立研發中心的真正原因〉一文中,作者說明了台灣被微軟等大公司選中、設立研發中心的主要原因;本文則繼續從企業與產品發展的角度,討論企業研發中心遭遇的問題、現況、轉型求生的方式、以及對人才的要求,帶您一窺新聞背後的種種考量。
    Thumbnail
    先說結論,以我從學生時代開始的觀察,在日本語言交換的市場裡: 英文>日文>韓文>中文; 女生比男生受歡迎。而學中文的日本人以男性居多(工作需要?),學韓文的日本人以女性居多(文化的影響?)。這次來日本作了兩次語言交換: 1. 台日語言交換: 日:台 = 1:3; 男:女 = 3:1 人數 12 人。
    Thumbnail
    <p>作者之所以將自己的目光鎖定這數以億計在貧窮裡掙扎的窮人,是要大家不要遺忘還有人在苦難中,報導這些無法爬上載滿機會的火車的人們。即便他們雖然處在無法翻身的境地,仍然充滿了勇氣與尊嚴。</p>