RAG（Retrieval-Augmented Generation，檢索增強生成）

更新於 2024/12/07發佈於 2024/12/07閱讀時間約 3 分鐘

前言

RAG（Retrieval-Augmented Generation，檢索增強生成）是一種提高生成式AI回答精確度的方法，本文簡要總結了RAG的相關內容。

什麼是RAG？

RAG是一種將外部資訊檢索與大型語言模型的文字生成相結合來提高大型語言模型答案精確度的技術。因為RAG使用外部資訊來產生答案，所以不需要為了提供新資訊給大語言模型而再一次進行學習，也不存在機密資訊被用於學習的風險。

RAG的應用實例

使用RAG可以簡化公司內部手冊等文件的檢索。因為公司內部手冊可能涉及機密資訊，不宜將其內容用於語言模型學習。使用RAG可以在不學習這些內容的情況下將其用於回答內容。另一方面即使內容不涉及機密資訊，也可以實現簡化。例如，查詢服務手冊或客戶支援。通常用戶需要查閱提供的手冊，或在遇到不明白的地方聯繫客戶服務，使用RAG可以簡化這個過程。

RAG的系統圖

系統圖可以總結如下圖所示，並分成七個步驟:

1. 文件分塊

將較長的文字輸入分割成較小的單位（稱為「塊」或「chunk」）。這個步驟對RAG的性能有重大影響：不同的分塊函式庫（如LangChain、Llama Index、SimplerLLM）可能會產生不同的分塊結果。另外分塊策略（如分割方式和長度）也會影響RAG的回答準確性。最近的研究正在探索最佳化分塊方法，以提高RAG的效能。

2. 向量化

將分割後的文本塊轉換為高維向量表示，這些向量通常有數千個維度。

通常使用預訓練的嵌入模型（如OpenAI或Amazon Titan Embeddings）來進行向量化。

3. 儲存向量

將向量化後的文本塊儲存在專門的向量資料庫中，常用的向量資料庫包括pgvector和Chroma DB。選擇向量資料庫時需考慮性能、相容性和特定使用場景的需求。

4. 查詢向量化

將用戶的查詢也轉換為向量表示。

5. 相似度搜索

在向量資料庫中搜索與查詢向量最相似的文本塊。

6. 組合輸入

將搜索到的相關文本塊與原始查詢組合，作為輸入傳遞給大型語言模型（如GPT-4、LLAMA、Gemini）。

7. 生成回答

大型語言模型根據提供的文字輸入生成最終回答。這個流程的每一步都對RAG系統的整體性能有重要影響。優化每個環節，特別是文件分塊和向量化步驟，可以大大提高RAG的效果。

留言

留言分享你的想法！

Kiki的沙龍

1會員

45內容數

心繫正體中文的科學家，立志使用正體中文撰寫文章。此沙龍預計涵蓋各項資訊科技知識分享與學習心得

Kiki的沙龍的其他內容

2025/04/27

自己在家組Ollama大語言模型伺服器

Meta 推出了開源大型語言模型 Llama。這一代特別引人注目，因為 80 億參數的模型小到可以在家用電腦上運行，效能卻不輸比它大十倍的模型。在許多應用場景下，它給出的回應品質已經能媲美 GPT-4。在這篇文章裡，我會說明自架 Llama 3 的優缺點，並提供設定方式與資源，讓讀者也能輕鬆動手。

2025/04/27

自己在家組Ollama大語言模型伺服器

2025/04/20

建立人工智慧代理人實務指引

這份實務指引旨在協助產品和工程團隊入門大型語言模型（LLM）驅動的人工智慧代理人建構，它定義了代理的核心概念，例如獨立執行任務和利用 LLM 管理工作流程決策。本文闡述了何時應考慮建立代理，特別是在傳統自動化方法受限的複雜情境，並深入探討了代理設計的基礎要素，包括模型選擇、工具整合及指令設置。

2025/04/20

建立人工智慧代理人實務指引

2025/04/06

用Docker Model Runner 輕鬆在本地執行 LLM

這篇文章將搭配簡單的範例，介紹最近推出的 Docker Model Runner。內容比較隨意粗略，希望能成為讓讀者了解這項工具的契機！

2025/04/06

用Docker Model Runner 輕鬆在本地執行 LLM

這篇文章將搭配簡單的範例，介紹最近推出的 Docker Model Runner。內容比較隨意粗略，希望能成為讓讀者了解這項工具的契機！

看更多

你可能也想看

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

每年4月、5月都是最多稅要繳的月份，當然大部份的人都是有機會繳到「綜合所得稅」，只是相當相當多人還不知道，原來繳給政府的稅！可以透過一些有活動的銀行信用卡或電子支付來繳，從繳費中賺一點點小確幸！就是賺個１%~2%大家也是很開心的，因為你們把沒回饋變成有回饋，就是用卡的最高境界所得稅線上申報

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

科技巨頭解碼

NVDA 25Q1 財報 - 扣除中國因素，輝達的前方仍然沒有烏雲 | #276

全球科技產業的焦點，AKA 全村的希望 NVIDIA，於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1，實際日曆期間為今年二到四月)，交出了打敗了市場預期的成績單。然而，在銷售持續高速成長的同時，川普政府加大對於中國的晶片管制......

#NVDA#NVIDIA#輝達

2025/06/18

科技巨頭解碼

NVDA 25Q1 財報 - 扣除中國因素，輝達的前方仍然沒有烏雲 | #276

#NVDA#NVIDIA#輝達

2025/06/18

美股 Insight

6月Fed會議：略為鷹派收斂2026、2027年降息預期，繼續維持高利率更長時間的觀望態度

重點摘要： 6 月繼續維持基準利率不變，強調維持高利率主因為關稅點陣圖表現略為鷹派，收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變，強調需要維持高利率是因為關稅：聯準會 (Fed) 召開 6 月利率會議

#Fed#聯準會#美股

2025/06/18

美股 Insight

6月Fed會議：略為鷹派收斂2026、2027年降息預期，繼續維持高利率更長時間的觀望態度

#Fed#聯準會#美股

2025/06/18

Bruce Chen的沙龍

L12202：如何善用生成式AI工具

如何善用生成式AI工具，如Prompt、RAG等。

#學習#人工智慧#AI

2025/04/15

Bruce Chen的沙龍

L12202：如何善用生成式AI工具

如何善用生成式AI工具，如Prompt、RAG等。

#學習#人工智慧#AI

2025/04/15

HKT實驗室

什麼是 RAG 驅動生成式 AI：如何客製化檢索增強系統 (RAG-Driven Generative AI)

RAG（Retrieval-Augmented Generation）技術結合資訊檢索與生成式 AI，解決傳統 AI 回答不準確的問題。RAG 通過檢索外部資料並生成更可靠的回答，提升準確性並降低成本。本文解析 RAG 的運作原理打造客製化 RAG 系統。

#RAG#生成式AI#LlamaIndex

2025/01/01

HKT實驗室

什麼是 RAG 驅動生成式 AI：如何客製化檢索增強系統 (RAG-Driven Generative AI)

#RAG#生成式AI#LlamaIndex

2025/01/01

Kiki的沙龍

檢索增強生成 RAG 簡介

檢索增強生成（Retrieval-Augmented Generation, RAG）是一種方法，可為您公司的私有資料提供客製化的 ChatGPT，使您更容易找到並使用所需的知識。它可以幫助您快速有效地與大量資訊互動。

2024/12/15

2024/12/15

RAG（Retrieval-Augmented Generation，檢索增強生成）

RAG（Retrieval-Augmented Generation，檢索增強生成）是一種提高生成式AI回答精確度的方法，本文簡要總結了RAG的相關內容。

#機器學習#人工智慧#AI人工智慧

2024/12/07

Kiki的沙龍

RAG（Retrieval-Augmented Generation，檢索增強生成）

RAG（Retrieval-Augmented Generation，檢索增強生成）是一種提高生成式AI回答精確度的方法，本文簡要總結了RAG的相關內容。

#機器學習#人工智慧#AI人工智慧

2024/12/07

Karen的沙龍

傳統智能客服 vs. RAG：誰能給你更好的答案？

本文章探討了 RAG（Retrieval-Augmented Generation）技術在智能客服領域的應用及其優勢。RAG 通過結合檢索與生成的特性，能夠顯著提高回答的準確性與靈活性。與傳統智能客服系統及純生成式 AI 相比，RAG 能更有效地理解用戶問題，並生成自然流暢的回應，改善用戶體驗。

#生成#用戶#客服

2024/11/13

Karen的沙龍

傳統智能客服 vs. RAG：誰能給你更好的答案？

#生成#用戶#客服

2024/11/13

廣告雜誌

從資料清洗到 RAG，大型語言模型的必需品，做出專屬企業的 AI 知識庫！

在當今快速變化的數位時代，企業面臨著前所未有的數據處理需求。為了應對這些挑戰，企業紛紛建立自己的大型語言模型（LLM），利用大量數據進行訓練，讓模型能夠理解並生成自然語言，從而實現人機協作，優化業務流程並提升客戶體驗。

#廣告雜誌#專欄#cacaFly

2024/07/31

廣告雜誌

從資料清洗到 RAG，大型語言模型的必需品，做出專屬企業的 AI 知識庫！

#廣告雜誌#專欄#cacaFly

2024/07/31

小凱的沙龍

生成式 AI 技術: 概念、應用和風險

生成式AI（Generative AI）能夠創造新內容和想法，包括對話、故事、圖像、視訊和音樂等。本文將介紹幾種生成式AI模型，以及其在設計製造、教育、客戶服務、媒體與娛樂、市場營銷領域的應用和風險。然後就生成式AI的應用，設計製造、教育、客戶服務、媒體與娛樂、市場營銷等相關領域提供了一些示例。

2024/05/19

2024/05/19

AGI 人工通用智慧 2028 到來的機率約50%

由於 ChatGPT 以及許多 GenAI 的爆發性成長，激發了大家對於 “超越人類智能” 的人工通用智能（AGI，Artificial General Intelligence）的議題，又重新引發了高度關注。 AGI 是指一種具有廣泛認知能力的人工智能系統，能夠像人類一樣理解、學習和適應各種不同

#人工智能#AlphaGo#ChatGPT

2024/03/31

未來的學習 X 學習的未來

AGI 人工通用智慧 2028 到來的機率約50%

#人工智能#AlphaGo#ChatGPT

2024/03/31

ChoozSEO

深入了解生成式AI：原理、優缺點及應用

生成式AI（Generative AI）是近年來人工智慧領域中備受矚目的技術之一。它以機器學習為基礎，通過學習大量數據中的模式和關係，能夠生成各種新的內容，涵蓋文字、圖像、音訊等多個領域。本文將深入探討生成式AI的原理、優缺點以及應用範疇。

2024/02/19

2024/02/19

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News