檢索增強生成(RAG)在檢索特定資訊時有效,但不適合回答整個語料庫的全域問題。這是因為全域問題需要關注查詢焦點摘要(QFS)而非明確的資訊檢索。
傳統QFS方法缺乏處理典型RAG系統所能索引的大量文本的能力。這使得有效回答大規模文本語料庫的問題變得困難。
現代大型語言模型(LLMs)能夠使用有限長度的來儲存輸入文字,但在處理非常大的文字語料庫時可能超出上下文長度的限制。這可能導致長文中間部分的資訊丟失風險。
Graph RAG(圖檢索增強生成)是一種利用LLMs構建的實體知識圖進行QFS的方法。這種方法使用以下兩階段過程來回答整個語料庫的全域問題:從源文件生成實體知識圖。
預先為密切相關的實體群組生成群組摘要。當收到問題時,使用每個群組摘要生成部分回答,最後將這些部分回答整合為全域回答。
可擴展性:Graph RAG能夠高效處理大量文本數據。通過利用群組摘要,可以分層地組織必要資訊,實現高效的檢索和摘要。改善全面性和多樣性:與傳統RAG方法相比,Graph RAG在回答的全面性(對問題的整體覆蓋)和多樣性(提供不同觀點和洞見)方面都表現出色。降低標記成本:使用群組摘要可以大幅減少所需的標記數量。特別是根層級的群組摘要在保持高效率的同時,顯著降低了標記成本。
Graph RAG是一種結合LLMs和圖技術的新方法,能夠高效地從整個語料庫進行問答。與傳統RAG方法相比,它大幅提高了問題回答的全面性和多樣性。此外,通過降低標記成本,實現了高效的資訊檢索和摘要。