使用Meta釋出的模型，實作Chat GPT - Part 3

更新於 2024/05/13發佈於 2024/04/29閱讀時間約 2 分鐘

延續使用Meta釋出的模型，實作Chat GPT - Part 2
我們已經確定可以進入HuggingFace之後，就要來載入模型，其對應程式為：

Model_Config = transformers.AutoConfig.from_pretrained(
               Model_ID, 
               use_auth_token = HF_Auth)


Model = transformers.AutoModelForCausalLM.from_pretrained(Model_ID,
        trust_remote_code = True,
        config = Model_Config,
        quantization_config = BitsAndBytes_Config,
        device_map = 'auto',
        use_auth_token = HF_Auth)

接著將模型設置為Inference模式，這時可以確認一下執行的裝置是CPU還是GPU，有GPU執行的話會快很多，然後再載入Tokenizer，它可以將一段話進行分詞，可以想像是切成一個字一個字，以便後續轉成向量給AI模型使用。

Model.eval()

print(f"Model Loaded on {Device}")

Tokenizer = transformers.AutoTokenizer.from_pretrained(
            Model_ID,
            use_auth_token = HF_Auth)

上述程式都輸入好之後，會長這樣，我們一樣按下「紅色框框」來執行，這部分因為涉及Meta大型語言模型下載，會需要一點時間，等待約56秒後，執行完成，「紅色框框」處會有綠色提示 (56秒處)

再來因應個人喜好或者是行業類別，可能我們希望大型語言模型輸出某些關鍵字之後就不要繼續生成下去，這時候我們可以指定這樣的關鍵字，其配置如下：

# Define Stoping Criteria of the Model

Stop_List = ['\nHuman:', '\n```\n']
Stop_Token_IDs = [Tokenizer(x)['input_ids'] for x in Stop_List]


import torch

Stop_Token_IDs = [torch.LongTensor(x).to(Device) for x in Stop_Token_IDs]

這部分輸入好之後長這樣，我們一樣按下「紅色框框」來執行，大約一秒後，執行完成，「紅色框框」處會有綠色提示 (0秒處)

Learn AI 不 BI自然語言處理相關

Learn AI 不 BI

188會員

501內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

留言0

查看全部

發表第一個留言支持創作者！

Learn AI 不 BI 的其他內容

ChatGPT回答不是你要的怎麼辦？

背景各位ChatGPT使用者是否常常發生以下狀況：ChatGPT跟你雞同鴨講。原因就出在ChatGPT當初在訓練時，在你所處的專業Domain並沒有足夠的訓練資料。針對這種情況要怎麼辦呢？今天將介紹幾種分法來解決，並分析各種方法的優劣。方法羅列提示工程 (Prompt E

#自然語言處理 #NLP #Huggingface

使用Meta釋出的模型，實作Chat GPT - Part 2

接著載入Part 2需要的相關依賴，其分別為： from torch import cuda, bfloat16import import transformers 然後選擇我們要的Meta模型，這邊可以是Llama 2或者是Llama 3，後者是Meta最新釋出的模型。同時我們也讓系統自

#自然語言處理 #NLP #Huggingface

使用Meta釋出的模型，實作Chat GPT - Part 1 | HuggingFace權限開啟教學

第一步先在Python環境中安裝本次專案需要用到的Library，相關指令如下： !pip install accelerate==0.21.0 !pip install transformers==4.31.0 !pip install tokenizers==0.13.3 !pip insta

#自然語言處理 #NLP #HuggingFace

ChatGPT回答不是你要的怎麼辦？

#自然語言處理 #NLP #Huggingface

使用Meta釋出的模型，實作Chat GPT - Part 2

#自然語言處理 #NLP #Huggingface

使用Meta釋出的模型，實作Chat GPT - Part 1 | HuggingFace權限開啟教學

#自然語言處理 #NLP #HuggingFace

你可能也想看

Google News 追蹤

♡ 後沙發的會客廳 ♡

2025/01/11

《表達與社交學》95 抱怨者嚇走強者，提問者吸引強者，所以貴人運天差地遠

提問的內容越是清晰，強者、聰明人越能在短時間內做判斷、給出精準的建議，他們會對你產生「好印象」，認定你是「積極」的人，有機會、好人脈會不自覺地想引薦給你

#後沙發 #貴人 #人脈

螃蟹_crab的沙龍

2024/07/25

[深度學習]訓練VAE模型用於生成圖片_生成篇

本文將延續上一篇文章，經由訓練好的VAE模型其中的解碼器，來生成圖片。 [深度學習]訓練VAE模型用於生成圖片_訓練篇輸入產生的隨機雜訊，輸入VAE的解碼器後，生成的圖片

#深度學習 #VAE模型 #生成圖片

柴郡貓姍蒂的沙龍

2024/07/23

筆記-深度學習模型訓練：利用殘差網路做影像辨識

前言讀了許多理論，是時候實際動手做做看了，以下是我的模型訓練初體驗，有點糟就是了XD。正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,

#深度學習 #AI #人工智慧

紫玉露的沙龍

2024/06/05

<AI攻略教學> 如何讓ChatGPT寫出Midjourney咒語?

這次這篇文章資源很多，三大送，送送送。好啦!直接進入正題巴我先送大家一個ChatGPT的指令寫出Midjourney的咒語

#AI繪圖 #ChatGPT #Midjourney

程式輕鬆玩

2024/05/15

ChatGPT：人工智慧的對話夥伴

ChatGPT（全名：聊天生成預訓練轉換器）是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出，使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型，並以強化學習進行訓練。

#ChatGPT #AI #OpenAI

每日發車

2024/05/06

筆記-曲博談AI模型.群聯-24.05.05

筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型三個步驟: 1.預訓練，訓練一次要用幾萬顆處理器、訓練時間要1個月，ChatGPT訓練一次的成本為1000萬美金。 2.微調(

技術PM路易斯的沙龍

2024/03/31

情緒勒索你的AI來得到最佳的結果

這陣子使用AI模型，還有參考國內外一些喜歡玩語言模型的同好發文，一個很有趣的結論就是，有時候把大型語言模型(尤其ChatGPT)當作一個人來溝通，會得到比較好的結果，這的確是非常反直覺的，也就是說很多時候ChatGPT耍懶不肯工作的時候，你用加油打氣，或是情緒勒索的方法，確實是可以得到比較好的結果。

#chatgpt #LLM #AI