使用Meta釋出的模型，實作Chat GPT - Part 5

2024/05/13 更新2024/05/01 發佈閱讀 7 分鐘

延續使用Meta釋出的模型，實作Chat GPT - Part 4，我們現在遇到一個問題：語言模型回答的資訊不是我想要的。

於是我參照 ChatGPT回答不是你要的怎麼辦？，想使用低成本的技術：RAG，來改善這問題。

以下開始實作，首先引入一個重量級工具包，它叫做LangChain，這是做語言模型AI在實作上的一個省力工具。

from langchain.llms import HuggingFacePipeline

LLM = HuggingFacePipeline(pipeline = Generate_Text)

這部分程式如下圖，我們一樣按下「紅色框框」處來執行，大約一秒鐘後，執行完成，「紅色框框」處會有綠色提示 (0秒處)。

然後我們回顧ChatGPT回答不是你要的怎麼辦？，RAG的核心思想就是索引外部資料庫，來當作我的大腦，往後我希望我的語言模型在回答問題之前可以先來這個大腦知識區索引一下資料。

我同時將兩種知識索引的程式都列出來給大家使用，一種是以網站資料為知識索引，另一種是以PDF文件為知識索引，大家可以二選一執行。

網站為知識索引

# ------------------- Web Version -------------------
from langchain.document_loaders import WebBaseLoader

Web_Links = ['https://1688.com']

Loader = WebBaseLoader(Web_Links)
Documents = Loader.load()

from langchain.text_splitter import RecursiveCharacterTextSplitter
Text_Splitter = RecursiveCharacterTextSplitter(chunk_size = 1000, chunk_overlap = 30)
All_Splits = Text_Splitter.split_documents(Documents)

這部分程式如下圖，我們一樣按下「紅色框框」處來執行，大約兩秒後，執行完成，「紅色框框」處會有綠色提示 (2秒處)。

PDF文件為知識索引

# ------------------- Single PDF Version -------------------

from langchain.document_loaders import PyPDFLoader

from google.colab import files
uploaded = files.upload()
Loader = PyPDFLoader('1688.pdf')
Documents = Loader.load()

from langchain.text_splitter import RecursiveCharacterTextSplitter
Text_Splitter = RecursiveCharacterTextSplitter(chunk_size = 500, chunk_overlap = 100)
All_Splits = Text_Splitter.split_documents(Documents)

這部分我們需要準備一個檔名叫做「1688.pdf」的文件，我的作法是直接到阿里巴巴首頁https://1688.com，然後按右鍵轉存pdf，這樣我就有該網頁的pdf檔案了。

這部分程式如下圖，我們一樣按下「紅色框框」處來執行，大約43秒後，執行完成，「紅色框框」處會有綠色提示 (43秒處)。

然後我希望不論透過上述哪種方式得到的知識都能存在一個向量資料庫，於是我要做Embedding，然後使用FAISS來儲存，它是Facebook開發的技術，全名叫做Facebook AI Similarity Search。

from langchain.embeddings import HuggingFaceEmbeddings
from langchain.vectorstores import FAISS

Model_Name = 'sentence-transformers/all-mpnet-base-v2'
Model_Kwargs = {"device": "cuda"}

Embedding = HuggingFaceEmbeddings(model_name = Model_Name, model_kwargs = Model_Kwargs)

VectorStore = FAISS.from_documents(All_Splits, Embedding)

這部分程式如下圖，我們一樣按下「紅色框框」處來執行，大約8秒後，執行完成，「紅色框框」處會有綠色提示 (8秒處)。

接著把我們的大型語言模型與上述的向量資料庫一起拼湊成RAG技術，作法如下：

from langchain.chains import ConversationalRetrievalChain

RAG = ConversationalRetrievalChain.from_llm(LLM, 
                                            VectorStore.as_retriever(), 
                                            return_source_documents = True)

這部分程式如下圖，我們一樣按下「紅色框框」處來執行，大約一秒後，執行完成，「紅色框框」處會有綠色提示 (1秒處)。

最後我們就可以問問題囉，我一樣問什麼是1688 ？

Chat_History = []

Query = "What is 1688 ?"

Result = RAG({"question": Query, "chat_history": Chat_History})
print(Result['answer'])

Chat_History.append((Query, Result['answer']))

這部分程式如下圖，我們一樣按下「紅色框框」處來執行，大約22秒後，執行完成，「紅色框框」處會有綠色提示 (22秒處)。

最後得到的回答是：

可以回顧一下使用Meta釋出的模型，實作Chat GPT - Part 4，之前回答我1688和威士忌有關係，加入RAG技術之後，他終於回答我正確答案：1688是一個電商平台，叫做阿里巴巴。

由上述實作可以看到引入大腦知識可以顯著讓大型語言模型得到你想要的答案的機率。

Learn AI 不 BI自然語言處理相關

留言

留言分享你的想法！

Learn AI 不 BI

244會員

948內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2024/05/25

我的AI專案思考路徑

最近接了一個AI專案，客戶要求以AI方式實現節能功能，以下提供我的專案思考軌跡：面對這樣的技術，我第一個想到使用Reinforcement Learning技術，然而這裡我思考一件事，這個專案是要幫助客戶賺錢的，在沒有Digital Twin的搭配之下，貿然使用Reinforcement L

2024/05/25

我的AI專案思考路徑

2024/05/25

怎麼學AI

上週發了一篇AI書單推薦今天來談談，我是怎麼學習的，我總共學了七年AI，自然對於一個小白想入門有更深刻的體悟，更能了解怎麼樣學習才能不至於一次面臨太多困難而放棄我的建議是這樣：先花兩年把Machine Learning學完，當中會遇到很多數學問題，這方面可以「在遇到問題時」再去翻

2024/05/25

怎麼學AI

2024/05/18

AI書單推薦

這篇介紹我看過的AI書籍中，覺得很棒的書單，我按照不同的AI作法來分類： Machine Learning: Pattern Recognition and Machine Learning, Christopher M. Bishop, 2011 The Elements of Statis

2024/05/18

AI書單推薦

看更多

你可能也想看

黛•Adele的生活隨筆

Sunkronizo 的 Playful Heart 是一款帶著明亮果香與柔和木質調的甜感香水，特別適合星期四使用。前調活潑、尾韻沉靜，陪你從忙碌過渡到週末的輕鬆心情。適合喜歡果香、花果香調的女性，也很適合作為溫暖又有個性的送禮選擇。可於官網、Pinkoi 選購，11 月底起於臺中國家歌劇院寄售。

2025/11/25

2025/11/25

今天又發現ChatGPT的一些缺點，使用時需要很準確的提供你想要表達的文字(我覺得還蠻重要的) 又或者拿一些範例給它看，它就能更準確的回答問題，因為今天我發現有一篇文章和之前寫過的完全一樣了，所以又要再請ChatGPT生成30則勵志英文短文，結果之前發問的問題已經消失了，又

2024/08/14

2024/08/14

因為網路上充斥著是是而非的資訊，公說公有理婆說婆有理，我發現我的價值觀開始有點混淆，心中有許多問題不知道真正的答案是甚麼？突然想到最近的AI新科技-ChatGPT 或許可以解答我內心的困惑。所以我試著與ChatGPT進行對話，沒想到ChatGPT 的回覆完全可以解答我心中的疑惑。

2024/07/16

2024/07/16

AI說書 - Prompt Engineering - 6

我們人類和ChatGPT的對話技巧也是需要學習的，有鑑於此，我想要一天分享一點「和ChatGPT對話的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。針對Generative AI、Foundation Model、Large Language Mode

#AI#ai#PromptEngineering

2024/06/12

Learn AI 不 BI

AI說書 - Prompt Engineering - 6

#AI#ai#PromptEngineering

2024/06/12

Learn AI 不 BI

AI說書 - Prompt Engineering - 3

我們人類和ChatGPT的對話技巧也是需要學習的，有鑑於此，我想要一天分享一點「和ChatGPT對話的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。在AI說書 - Prompt Engineering - 2中，我們已經以文字敘述各種AI的範疇與其思想

#AI#ai#PromptEngineering

2024/06/06

Learn AI 不 BI

AI說書 - Prompt Engineering - 3

#AI#ai#PromptEngineering

2024/06/06

程式輕鬆玩

ChatGPT：人工智慧的對話夥伴

ChatGPT（全名：聊天生成預訓練轉換器）是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出，使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型，並以強化學習進行訓練。

2024/05/15

2024/05/15

筆記-曲博談AI模型.群聯-24.05.05

筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型三個步驟: 1.預訓練，訓練一次要用幾萬顆處理器、訓練時間要1個月，ChatGPT訓練一次的成本為1000萬美金。 2.微調(

2024/05/06

每日發車

筆記-曲博談AI模型.群聯-24.05.05

2024/05/06

技術PM路易斯的沙龍

情緒勒索你的AI來得到最佳的結果

這陣子使用AI模型，還有參考國內外一些喜歡玩語言模型的同好發文，一個很有趣的結論就是，有時候把大型語言模型(尤其ChatGPT)當作一個人來溝通，會得到比較好的結果，這的確是非常反直覺的，也就是說很多時候ChatGPT耍懶不肯工作的時候，你用加油打氣，或是情緒勒索的方法，確實是可以得到比較好的結果。

2024/03/31

2024/03/31

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News