RAG(Retrieval-Augmented Generation,檢索增強生成)中的Retriever(檢索器)是指專門負責從外部知識庫或大型資料庫中快速查找與用戶輸入問題或提示相關資訊的模組。它是RAG模型的核心組成部分之一,目的是為生成模型(如大型語言模型)提供額外且精確的上下文信息,以提升回答的準確性和相關性。
具體來說,Retriever的功能包括:
- 根據用戶的查詢,透過向量檢索或關鍵字檢索技術,從龐大的文檔集合中找到最相關的文本片段或文件。
- 通常會利用向量檢索引擎(如FAISS)將文本轉換成低維向量,再通過相似度計算找到最佳匹配。
- 檢索出的相關內容會被提供給生成模型作為輔助信息,使模型能基於最新、具體的資料生成更有依據且精確的回答。
- Retriever有效彌補了純生成模型只依賴訓練資料所帶來的知識有限性,讓模型即便面對最新或領域特定的問題,也能從動態更新的資料庫中獲取答案。
常用的檢索方法包括基於向量相似度(如餘弦相似度)的稠密檢索(Dense Retrieval)。
總結:RAG中的Retriever是用來快速且精確從大量資料中搜尋相關信息的模組,其結果為生成模型提供上下文支持,提升生成回答的準確度和內容深度。



















