「RAG + 微調」混合架構 - AI 公司最常用的 dataset 技術

更新 發佈閱讀 7 分鐘

現在 AI 公司最常用的 dataset 技術

「RAG + 微調」混合架構

它能讓小模型能力 提升 5~20 倍

目前 AI 系統非常主流的一種架構:RAG + 微調(Fine-tuning)混合架構。很多公司都使用這種方法來打造專業 AI 助手,因為它能讓模型既有知識又能查最新資料。


一、什麼是 RAG

RAG(Retrieval-Augmented Generation) 檢索增強生成的概念是:

</>Plain text
使用者問題


搜尋知識庫(向量資料庫)


把找到的資料加入 Prompt


LLM 生成回答

簡單說:

模型不記住所有知識,而是需要時去查資料。


二、RAG 的基本架構

</>Plain text
文件 → 切分 → 向量化 → 向量資料庫


使用者問題 → 向量搜尋 → 找到相關內容


LLM + context → 回答

常見元件:

raw-image

常用向量資料庫:

  • FAISS
  • Milvus
  • Chroma

三、Python RAG 簡化範例

假設你有一堆文件:

</>Plain text
documents/
tang_history.txt
wuxia_skills.txt

先做 embedding:

</>Python
from sentence_transformers import SentenceTransformer
import faiss

model = SentenceTransformer("all-MiniLM-L6-v2")

docs = [
"安祿山是唐朝節度使",
"華山派以劍法聞名",
"寒元真訣是一種內功"
]

embeddings = model.encode(docs)

建立向量索引:

</>Python
index = faiss.IndexFlatL2(384)
index.add(embeddings)

查詢:

</>Python
query = model.encode(["安祿山是誰"])

D, I = index.search(query, k=2)

print([docs[i] for i in I[0]])

找到相關知識:

</>Plain text
安祿山是唐朝節度使

然後把它放進 Prompt:

</>Plain text
Context:
安祿山是唐朝節度使

Question:
安祿山是誰

LLM 就能回答。


四、RAG 的優點

raw-image

所以企業很愛用。


五、RAG 的缺點

raw-image

因此很多公司會:

RAG + 微調


六、RAG + Fine-tuning

混合架構:

</>Plain text
┌─────────────┐
LLM 模型 │
(微調過)
└──────┬──────┘

加入 RAG context


最終回答

微調負責:

  • 回答風格
  • 專業推理
  • tool calling

RAG 負責:

  • 提供知識
  • 更新資料

七、為何混合架構效果最好

原因很簡單:

LLM 記憶是有限的。

例如:

7B 模型

</>Plain text
參數 ≈ 7B

但公司資料:

</>Plain text
文件 ≈ 100GB

模型不可能全部記住。

所以:

</>Plain text
模型負責推理
RAG 負責記憶

八、企業實際應用

很多 AI 系統是這樣:

</>Plain text
使用者


API


RAG 搜尋


LLM(微調)


回答

例如 AI 客服:

  • 產品文件
  • FAQ
  • 公司規則

都存在 RAG。


九、4090 可以跑完整 RAG

一台 RTX4090 就可以:

raw-image

甚至可以在家做 私人 AI 知識庫


十、很少人知道的關鍵技巧

真正強的 RAG 不是「直接塞文件」。

而是:

Chunk + Metadata

例如:

</>Plain text
文件


切成 500 tokens


加 metadata

例子:

</>JSON
{
"text":"安祿山是唐朝節度使",
"source":"tang_history",
"year":755
}

這樣搜尋更準確。


十一、RAG 進階技術

目前最強的 RAG 系統會加:

1️⃣ Re-ranking

2️⃣ Multi-query search

3️⃣ Graph RAG

Graph RAG 很熱門。


十二、Graph RAG

不是只存文字,而是存 知識關係

例如:

</>Plain text
安祿山 → 發動 → 安史之亂
安祿山 → 對抗 → 唐玄宗

這種圖資料庫:

  • Neo4j(Graph Database Management System)

LLM 查詢後再回答。


總結

現在最主流 AI 架構:

</>Plain text
RAG + Fine-tuning + Tool calling

能力:

  • 查資料
  • 推理
  • 用工具

這就是現代 AI agent 的基礎。


留言
avatar-img
sirius數字沙龍
11會員
250內容數
吃自助火鍋啦!不要客氣,想吃啥,請自行取用!
sirius數字沙龍的其他內容
2026/03/06
一步一步示範 Self-Instruct(自動生成訓練資料)的方法。 這是很多模型(如 OpenAI、Stanford University 研究團隊)提出並實際使用的技巧,可以用一個強模型自動生成大量資料,然後用來微調另一個模型。
Thumbnail
2026/03/06
一步一步示範 Self-Instruct(自動生成訓練資料)的方法。 這是很多模型(如 OpenAI、Stanford University 研究團隊)提出並實際使用的技巧,可以用一個強模型自動生成大量資料,然後用來微調另一個模型。
Thumbnail
2026/03/06
這是很多人自己做「私人 AI 助手 / 領域模型」的典型做法。整體分成:模型選擇 → 資料 → 訓練 → 推論部署。 一、硬體條件(RTX 4090) RTX 4090 VRAM:24GB FP16 算力:約 82 TFLOPS 適合:LoRA / QLoRA 微調 能訓練模型大小:
Thumbnail
2026/03/06
這是很多人自己做「私人 AI 助手 / 領域模型」的典型做法。整體分成:模型選擇 → 資料 → 訓練 → 推論部署。 一、硬體條件(RTX 4090) RTX 4090 VRAM:24GB FP16 算力:約 82 TFLOPS 適合:LoRA / QLoRA 微調 能訓練模型大小:
Thumbnail
2026/03/06
示範一個 RTX 4090 用於訓練 LLM「工具調用(Tool Calling)」的資料格式。這種格式比原本的 Python 範例更接近 OpenAI / Llama / DeepSeek / function calling dataset 常見結構。
Thumbnail
2026/03/06
示範一個 RTX 4090 用於訓練 LLM「工具調用(Tool Calling)」的資料格式。這種格式比原本的 Python 範例更接近 OpenAI / Llama / DeepSeek / function calling dataset 常見結構。
Thumbnail
看更多
你可能也想看
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
本文探討長期穩定的內容輸出,如何將個人專業轉化為可被搜尋、收藏、重讀的內容資產,進而建立個人品牌,吸引長期關注與合作機會,並強調其超越短期曝光的價值。
Thumbnail
本文探討長期穩定的內容輸出,如何將個人專業轉化為可被搜尋、收藏、重讀的內容資產,進而建立個人品牌,吸引長期關注與合作機會,並強調其超越短期曝光的價值。
Thumbnail
AI 寫文案!行銷技能:SEO、分析、提案-邱允文 在現今數位行銷的世界中,AI 可以幫助行銷人員提高工作效率,改善內容並提升業務成果。特別是在以下三個方面:SEO、資料分析、提案設計。這些都是行銷人的必備技能,使用 AI 可以大大提升效果與精度。 1. SEO(搜尋引擎改善) SEO 是指
Thumbnail
AI 寫文案!行銷技能:SEO、分析、提案-邱允文 在現今數位行銷的世界中,AI 可以幫助行銷人員提高工作效率,改善內容並提升業務成果。特別是在以下三個方面:SEO、資料分析、提案設計。這些都是行銷人的必備技能,使用 AI 可以大大提升效果與精度。 1. SEO(搜尋引擎改善) SEO 是指
Thumbnail
立達徵信社擁有專業偵探團隊及多年實地調查經驗,無論手中線索多寡,我們都能透過地毯式搜索,協助客戶精準找到墳墓或祖墳的位置。若想諮詢費用或有委託需求,敬請致電立達徵信0800-250-555,專人隨時為您服務。找墳墓、建立族譜/家庭樹、親人協尋服務,立達私家偵探您的第一首選。
Thumbnail
立達徵信社擁有專業偵探團隊及多年實地調查經驗,無論手中線索多寡,我們都能透過地毯式搜索,協助客戶精準找到墳墓或祖墳的位置。若想諮詢費用或有委託需求,敬請致電立達徵信0800-250-555,專人隨時為您服務。找墳墓、建立族譜/家庭樹、親人協尋服務,立達私家偵探您的第一首選。
Thumbnail
現在,台灣大哥大攜手 Perplexity AI,為所有台灣大哥大用戶帶來一個令人興奮的機會:免費享有 Perplexity Pro 一年!(價值8,280元)這不僅是一項優惠,更是一個讓台灣用戶搶先體驗 AI 驅動搜尋新紀元的絕佳機會。 跨時代革命性 AI 搜尋引擎,整合大型語言模型 (LL
Thumbnail
現在,台灣大哥大攜手 Perplexity AI,為所有台灣大哥大用戶帶來一個令人興奮的機會:免費享有 Perplexity Pro 一年!(價值8,280元)這不僅是一項優惠,更是一個讓台灣用戶搶先體驗 AI 驅動搜尋新紀元的絕佳機會。 跨時代革命性 AI 搜尋引擎,整合大型語言模型 (LL
Thumbnail
Consensus 是一款專為學術研究設計的 AI 搜尋引擎,提供準確且具公信力的學術資料,可幫助研究者和學生快速找到引用次數最多的研究資料,並評估資料的價值和可靠性。這篇文章介紹了 Consensus 的功能、如何使用以及其優勢與特點,並分享了使用心得和應用場景。
Thumbnail
Consensus 是一款專為學術研究設計的 AI 搜尋引擎,提供準確且具公信力的學術資料,可幫助研究者和學生快速找到引用次數最多的研究資料,並評估資料的價值和可靠性。這篇文章介紹了 Consensus 的功能、如何使用以及其優勢與特點,並分享了使用心得和應用場景。
Thumbnail
這篇文章訴說了盧小小應對丈夫外遇的過程,從宣示主權到求助神明再到訴諸法律,最終找到專業徵信社協助,經過一系列波折打贏了官司,證據及戰略應對是關鍵。這篇相當精彩。
Thumbnail
這篇文章訴說了盧小小應對丈夫外遇的過程,從宣示主權到求助神明再到訴諸法律,最終找到專業徵信社協助,經過一系列波折打贏了官司,證據及戰略應對是關鍵。這篇相當精彩。
Thumbnail
近期有感房市下修,且房貸利率不段攀升下,對於目前正背負房貸及未來想要購屋的族群而言,壓力添增不少,然而,法拍市場正搶手, 透過法院拍賣,以較為優勢的價格取得房子,大大減輕購屋族的經濟壓力,但法拍屋應該自己投標或委託專業的法拍代標公司呢?本篇將帶您瞭解法拍代標公司提供哪些服務。
Thumbnail
近期有感房市下修,且房貸利率不段攀升下,對於目前正背負房貸及未來想要購屋的族群而言,壓力添增不少,然而,法拍市場正搶手, 透過法院拍賣,以較為優勢的價格取得房子,大大減輕購屋族的經濟壓力,但法拍屋應該自己投標或委託專業的法拍代標公司呢?本篇將帶您瞭解法拍代標公司提供哪些服務。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News