RAG(Retrieval-Augmented Generation,檢索增強生成)

更新 發佈閱讀 3 分鐘

前言

RAG(Retrieval-Augmented Generation,檢索增強生成)是一種提高生成式AI回答精確度的方法,本文簡要總結了RAG的相關內容。


什麼是RAG?

RAG是一種將外部資訊檢索與大型語言模型的文字生成相結合來提高大型語言模型答案精確度的技術。因為RAG使用外部資訊來產生答案,所以不需要為了提供新資訊給大語言模型而再一次進行學習,也不存在機密資訊被用於學習的風險。


RAG的應用實例

使用RAG可以簡化公司內部手冊等文件的檢索。因為公司內部手冊可能涉及機密資訊,不宜將其內容用於語言模型學習。使用RAG可以在不學習這些內容的情況下將其用於回答內容。另一方面即使內容不涉及機密資訊,也可以實現簡化。例如,查詢服務手冊或客戶支援。通常用戶需要查閱提供的手冊,或在遇到不明白的地方聯繫客戶服務,使用RAG可以簡化這個過程。


RAG的系統圖

系統圖可以總結如下圖所示,並分成七個步驟:

raw-image


1. 文件分塊

將較長的文字輸入分割成較小的單位(稱為「塊」或「chunk」)。這個步驟對RAG的性能有重大影響:不同的分塊函式庫(如LangChain、Llama Index、SimplerLLM)可能會產生不同的分塊結果。另外分塊策略(如分割方式和長度)也會影響RAG的回答準確性。最近的研究正在探索最佳化分塊方法,以提高RAG的效能。

2. 向量化

將分割後的文本塊轉換為高維向量表示,這些向量通常有數千個維度。

通常使用預訓練的嵌入模型(如OpenAI或Amazon Titan Embeddings)來進行向量化。

3. 儲存向量

將向量化後的文本塊儲存在專門的向量資料庫中,常用的向量資料庫包括pgvector和Chroma DB。選擇向量資料庫時需考慮性能、相容性和特定使用場景的需求。

4. 查詢向量化

將用戶的查詢也轉換為向量表示。

5. 相似度搜索

在向量資料庫中搜索與查詢向量最相似的文本塊。

6. 組合輸入

將搜索到的相關文本塊與原始查詢組合,作為輸入傳遞給大型語言模型(如GPT-4、LLAMA、Gemini)。

7. 生成回答

大型語言模型根據提供的文字輸入生成最終回答。這個流程的每一步都對RAG系統的整體性能有重要影響。優化每個環節,特別是文件分塊和向量化步驟,可以大大提高RAG的效果。

留言
avatar-img
留言分享你的想法!
avatar-img
Kiki的沙龍
3會員
48內容數
心繫正體中文的科學家,立志使用正體中文撰寫文章。 此沙龍預計涵蓋各項資訊科技知識分享與學習心得
Kiki的沙龍的其他內容
2025/04/27
Meta 推出了開源大型語言模型 Llama。這一代特別引人注目,因為 80 億參數的模型小到可以在家用電腦上運行,效能卻不輸比它大十倍的模型。在許多應用場景下,它給出的回應品質已經能媲美 GPT-4。在這篇文章裡,我會說明自架 Llama 3 的優缺點,並提供設定方式與資源,讓讀者也能輕鬆動手。
2025/04/27
Meta 推出了開源大型語言模型 Llama。這一代特別引人注目,因為 80 億參數的模型小到可以在家用電腦上運行,效能卻不輸比它大十倍的模型。在許多應用場景下,它給出的回應品質已經能媲美 GPT-4。在這篇文章裡,我會說明自架 Llama 3 的優缺點,並提供設定方式與資源,讓讀者也能輕鬆動手。
2025/04/20
這份實務指引旨在協助產品和工程團隊入門 大型語言模型(LLM)驅動的人工智慧代理人建構,它定義了代理的核心概念,例如獨立執行任務和利用 LLM 管理工作流程決策。本文闡述了何時應考慮建立代理,特別是在傳統自動化方法受限的複雜情境,並深入探討了代理設計的基礎要素,包括模型選擇、工具整合及指令設置。
2025/04/20
這份實務指引旨在協助產品和工程團隊入門 大型語言模型(LLM)驅動的人工智慧代理人建構,它定義了代理的核心概念,例如獨立執行任務和利用 LLM 管理工作流程決策。本文闡述了何時應考慮建立代理,特別是在傳統自動化方法受限的複雜情境,並深入探討了代理設計的基礎要素,包括模型選擇、工具整合及指令設置。
2025/04/06
這篇文章將搭配簡單的範例,介紹最近推出的 Docker Model Runner。內容比較隨意粗略,希望能成為讓讀者了解這項工具的契機!
2025/04/06
這篇文章將搭配簡單的範例,介紹最近推出的 Docker Model Runner。內容比較隨意粗略,希望能成為讓讀者了解這項工具的契機!
看更多
你可能也想看
Thumbnail
如何善用生成式AI工具,如Prompt、RAG等。
Thumbnail
如何善用生成式AI工具,如Prompt、RAG等。
Thumbnail
RAG(Retrieval-Augmented Generation)技術結合資訊檢索與生成式 AI,解決傳統 AI 回答不準確的問題。RAG 通過檢索外部資料並生成更可靠的回答,提升準確性並降低成本。本文解析 RAG 的運作原理打造客製化 RAG 系統。
Thumbnail
RAG(Retrieval-Augmented Generation)技術結合資訊檢索與生成式 AI,解決傳統 AI 回答不準確的問題。RAG 通過檢索外部資料並生成更可靠的回答,提升準確性並降低成本。本文解析 RAG 的運作原理打造客製化 RAG 系統。
Thumbnail
檢索增強生成(Retrieval-Augmented Generation, RAG)是一種方法,可為您公司的私有資料提供客製化的 ChatGPT,使您更容易找到並使用所需的知識。它可以幫助您快速有效地與大量資訊互動。
Thumbnail
檢索增強生成(Retrieval-Augmented Generation, RAG)是一種方法,可為您公司的私有資料提供客製化的 ChatGPT,使您更容易找到並使用所需的知識。它可以幫助您快速有效地與大量資訊互動。
Thumbnail
RAG(Retrieval-Augmented Generation,檢索增強生成)是一種提高生成式AI回答精確度的方法,本文簡要總結了RAG的相關內容。
Thumbnail
RAG(Retrieval-Augmented Generation,檢索增強生成)是一種提高生成式AI回答精確度的方法,本文簡要總結了RAG的相關內容。
Thumbnail
本文章探討了 RAG(Retrieval-Augmented Generation)技術在智能客服領域的應用及其優勢。RAG 通過結合檢索與生成的特性,能夠顯著提高回答的準確性與靈活性。與傳統智能客服系統及純生成式 AI 相比,RAG 能更有效地理解用戶問題,並生成自然流暢的回應,改善用戶體驗。
Thumbnail
本文章探討了 RAG(Retrieval-Augmented Generation)技術在智能客服領域的應用及其優勢。RAG 通過結合檢索與生成的特性,能夠顯著提高回答的準確性與靈活性。與傳統智能客服系統及純生成式 AI 相比,RAG 能更有效地理解用戶問題,並生成自然流暢的回應,改善用戶體驗。
Thumbnail
在當今快速變化的數位時代,企業面臨著前所未有的數據處理需求。為了應對這些挑戰,企業紛紛建立自己的大型語言模型(LLM),利用大量數據進行訓練,讓模型能夠理解並生成自然語言,從而實現人機協作,優化業務流程並提升客戶體驗。
Thumbnail
在當今快速變化的數位時代,企業面臨著前所未有的數據處理需求。為了應對這些挑戰,企業紛紛建立自己的大型語言模型(LLM),利用大量數據進行訓練,讓模型能夠理解並生成自然語言,從而實現人機協作,優化業務流程並提升客戶體驗。
Thumbnail
生成式AI(Generative AI)能夠創造新內容和想法,包括對話、故事、圖像、視訊和音樂等。本文將介紹幾種生成式AI模型,以及其在設計製造、教育、客戶服務、媒體與娛樂、市場營銷領域的應用和風險。然後就生成式AI的應用,設計製造、教育、客戶服務、媒體與娛樂、市場營銷等相關領域提供了一些示例。
Thumbnail
生成式AI(Generative AI)能夠創造新內容和想法,包括對話、故事、圖像、視訊和音樂等。本文將介紹幾種生成式AI模型,以及其在設計製造、教育、客戶服務、媒體與娛樂、市場營銷領域的應用和風險。然後就生成式AI的應用,設計製造、教育、客戶服務、媒體與娛樂、市場營銷等相關領域提供了一些示例。
Thumbnail
由於 ChatGPT 以及許多 GenAI 的爆發性成長,激發了大家對於 “超越人類智能” 的人工通用智能(AGI,Artificial General Intelligence)的議題,又重新引發了高度關注。 AGI 是指一種具有廣泛認知能力的人工智能系統,能夠像人類一樣理解、學習和適應各種不同
Thumbnail
由於 ChatGPT 以及許多 GenAI 的爆發性成長,激發了大家對於 “超越人類智能” 的人工通用智能(AGI,Artificial General Intelligence)的議題,又重新引發了高度關注。 AGI 是指一種具有廣泛認知能力的人工智能系統,能夠像人類一樣理解、學習和適應各種不同
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News