🤖 用 RAG + Multi-Agent + Docker 打造會自己協作的智能文件助理

阿Han

發佈於阿Han的軟體技術棧 💡

2025/09/18 更新2025/09/18 發佈閱讀 4 分鐘

你有沒有遇過這樣的情況：打開一份上百頁的 PDF 文件，只是為了找一個小小的答案，結果花了半小時還翻不到重點？

我常常在讀技術文件或研究資料時，都遇到這種麻煩，於是我開始想：能不能做一個「文件助理」，讓我可以直接問它問題，它會自動在文件裡找到相關內容，再用 AI 幫我整理答案？

就這樣，我設計並實作了一個專案：RAG × Multi-Agent 文件助理。它能支援 PDF 與 Markdown 檔案，具備自我協作的能力，並且可以在本地一鍵部署，這篇文章我會分享這個專案是怎麼設計出來的，以及其中一些有趣的技術細節。

為什麼要做這個專案？

這個想法一開始很單純：我想要一個能「直接回答文件問題」的工具。

後來我發現，光靠一個 LLM 其實效果不佳，需要加上「檢索」與「多代理協作」，才能讓答案更可靠，於是這個專案就誕生了，我們除了找答案之外，更要智能化，關鍵就在於RAG與Multi-Agent 多代理架構。

• RAG（Retrieval-Augmented Generation）檢索增強生成：讓 AI 在回答前，先去文件裡找相關段落，再生成答案。

• Multi-Agent 多代理架構：把任務拆分成不同「小助手」，例如有人專門讀文件、有人專門檢索、有人專門回答，最後一起協作完成工作。

這樣設計出來的系統，答案品質會更高，而且更容易擴展。

🛠 系統設計與架構

這個系統分成幾個核心模組：

• 文件載入（Data Loader Agent）：支援 PDF 和 Markdown，先把文件切片、清理。

• 索引與檢索（LlamaIndex + FAISS）：建立向量索引，就像「圖書館的索引卡」，快速找到相關段落。

• 問答生成（QA Agent）：根據檢索到的內容，生成最終回答。

• 多代理協作（AutoGen）：讓不同 Agent 能互相對話、協同完成任務。

• 模型管理（Ollama）：在本地環境跑大模型，不需要把資料送到雲端。

• 使用介面（Streamlit）：提供簡單的 Web 聊天框，直接上傳文件、提問。

• 部署（Docker Compose）：一鍵啟動整套服務，方便快速體驗。

⚡ 快速上手

我希望這個專案「簡單到人人都能試」，不過會有點工程技術，需要先請您安裝docker，如果您還不知道什麼是Docker的話，歡迎參考：「【Docker 容器化】初探微服務時代的虛擬化技術」

只要四步驟：

git clone https://github.com/weihanchen/rag-multiagent-qa

# 建置服務
docker compose build

# 啟動服務
docker compose up -d

# 下載模型
docker exec rag-ollama ollama pull llama2:7b

啟動服務後，打開瀏覽器 http://localhost:8501 ，就能上傳文件，開始問答。

🤔 開發心得與技術選擇

在開發過程中，我遇到一些挑戰，也做了幾個技術選擇：

• 為什麼選 AutoGen？

• 為什麼用 FAISS？

• 為什麼要本地部署？

• 最大的挑戰？

這些問題解決後，系統的體驗大幅提升。

🎯 結語

對我來說，這個專案不只是技術實驗，更是一個能解決日常痛點的小幫手。

如果你也常常需要翻厚厚的文件，不妨試試這個「能自己協作的文件助理」。

👉 專案 GitHub 連結

我也很好奇：如果你有這樣的 AI 助理，你會最想用它來幫忙做什麼？歡迎下方留言告訴我！

阿Han的沙龍阿Han的軟體技術棧 💡AI

留言

留言分享你的想法！

阿Han的沙龍

142會員

308內容數

哈囉，我是阿Han，是一位 👩‍💻 軟體研發工程師，喜歡閱讀、學習、撰寫文章及教學，擅長以圖代文，化繁為簡，除了幫助自己釐清思路之外，也希望藉由圖解的方式幫助大家共同學習，甚至手把手帶您設計出高品質的軟體產品。

阿Han的沙龍的其他內容

2025/07/02

【MLOps - Airflow 疑難雜症】別讓任務跑到天荒地老 - Timeout 終極設定指南

🧵 一個小故事在某個星期六的清晨，工程師小明被監控的訊息吵醒， Airflow 上的任務居然跑了 16 個小時還沒結束！原來是某支資料轉換腳本卡在網路重連邏輯中，無限重試，一路跑進週末。這時候小明邊泡咖啡邊想：「要是早點加上 timeout，就不用週末加班了...」。 🧠 為什麼

2025/07/02

【MLOps - Airflow 疑難雜症】別讓任務跑到天荒地老 - Timeout 終極設定指南

2025/06/18

【🎧 common-voice 語音資料蒐集程式】架設啟動的一些雷坑 💣

Common Voice 是 Mozilla 發起的一個開源專案，目的是建立一個大型、公開、自由可用的語音資料庫，讓任何人（尤其是研究人員、開發者、公司）都可以用來訓練語音辨識、語音合成（TTS）等人工智慧應用。很幸運的， Common Voice也將原始碼提供給大家使用，在 🔍 h

2025/06/18

【🎧 common-voice 語音資料蒐集程式】架設啟動的一些雷坑 💣

2025/06/11

【MLOps - Airflow 疑難雜症】Docker環境下如何操作宿主主機？

關於Airflow是什麼，歡迎參考「🔒 阿Han的軟體心法實戰營 - MLOps」，在開始之前我們也推薦以下兩篇給您閱讀：【🔒 MLOps - Airflow】使用docker compose架設Airflow 【🔒 MLOps - Airflow】使用DAG流程呼叫Docker O

2025/06/11

【MLOps - Airflow 疑難雜症】Docker環境下如何操作宿主主機？

看更多

你可能也想看

方格子 vocus 官方沙龍

線上街訪直擊！雙 11 購物車大公開！

雙11於許多人而言，不只是單純的折扣狂歡，更是行事曆裡預定的，對美好生活的憧憬。錢錢沒有不見，它變成了快樂，跟讓臥房、辦公桌、每天早晨的咖啡香升級的樣子！這次格編突擊辦公室，也邀請 vocus「野格團」創作者分享掀開蝦皮購物車的簾幕，「加入購物車」的瞬間，藏著哪些靈感，或是對美好生活的想像？

#vocusforBusiness#雙11#蝦皮分潤計畫

2025/10/28

方格子 vocus 官方沙龍

線上街訪直擊！雙 11 購物車大公開！

#vocusforBusiness#雙11#蝦皮分潤計畫

2025/10/28

Chloe小窩

租屋整理控必看 | 雙11收納好物開箱 × 蝦皮分潤計畫

雙11購物節準備開跑，蝦皮推出超多優惠，與你分享實際入手的收納好物，包括貨櫃收納箱、真空收納袋、可站立筆袋等，並分享如何利用蝦皮分潤計畫，一邊購物一邊賺取額外收入，讓你買得開心、賺得也開心！

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

Chloe小窩

租屋整理控必看 | 雙11收納好物開箱 × 蝦皮分潤計畫

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

邊境牧羊犬的觀察筆記

開箱｜我為新家買的 5 樣家居好物！蝦皮購物實用選品

分享個人在新家裝潢後，精選 5 款蝦皮上的實用家居好物，包含客製化層架、MIT 地毯、沙發邊桌、分類垃圾桶及寵物碗架，從尺寸、功能到價格都符合需求，並提供詳細開箱心得與購買建議。

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

邊境牧羊犬的觀察筆記

開箱｜我為新家買的 5 樣家居好物！蝦皮購物實用選品

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

Lea Wicquart的沙龍

AI PDF Editor: The Future of Document Management

Introduction AI PDF editors not only enhance efficiency but also bring a more intelligent and convenient user experience.

#人工智慧#人工智能#pdf

2024/08/14

Lea Wicquart的沙龍

AI PDF Editor: The Future of Document Management

Introduction AI PDF editors not only enhance efficiency but also bring a more intelligent and convenient user experience.

#人工智慧#人工智能#pdf

2024/08/14

彼得的外商隨筆

我的 AI 助理：從草稿到成品的文章創作流程

這篇文章描述作者如何利用 AI 技術（如 ChatGPT）來輔助撰寫文章的過程。作者詳細拆解了自己的寫作流程，並闡述了每個環節中如何使用 AI 來提高效率。文章強調 AI 在工作流程中所帶來的改變，並指出要適應這種改變需要一定的時間和練習。

#AI#寫作

2024/07/13

彼得的外商隨筆

我的 AI 助理：從草稿到成品的文章創作流程

#AI#寫作

2024/07/13

leqi.ai

【學術類】科研人必備的AI工具合集（一）

本文介紹了AI科研文獻管理工具，包括Connected Papers、EasyScholar、Research Rabbit、ReadPaper、立理 LitLit、海鯨AI學術、pdftopdf.ai等。這些工具能幫助科研人員實現高效的文獻管理和利用文獻資源，並提高科研工作的效率和質量。

2024/07/03

2024/07/03

pdf轉文本工具：提高辦公效率的OCR工具

在數字化時代，PDF文件廣泛使用，但傳統處理方式顯得力不從心。本文推薦pdftopdf.ai等工具，通過OCR識別，將圖片中的文字轉化為可編輯、可搜索的文本。探討PDF文檔分析的AI工具，功能和價格。描述其用途以解決掃描件中文字無法直接搜索的困擾，提高工作效率。

#文件#編輯#人工智能

2024/06/24

leqi.ai

pdf轉文本工具：提高辦公效率的OCR工具

#文件#編輯#人工智能

2024/06/24

leqi.ai

如何利用OCR技術提高PDF文檔處理效率

學習如何將掃描的PDF轉換為可搜索文本，並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。

#學習#學術#電子

2024/06/11

leqi.ai

如何利用OCR技術提高PDF文檔處理效率

學習如何將掃描的PDF轉換為可搜索文本，並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。

#學習#學術#電子

2024/06/11

leqi.ai

如何將掃描PDF轉換為可搜索文本以提升工作效率

在信息化時代，PDF文件無處不在。無論是學術研究、商業文件還是個人檔案，PDF都已成為最常見的文檔格式。然而，許多PDF文件是通過掃描紙質文檔生成的，這些文件中的文字無法直接編輯或複製。借助先進的OCR技術，使用者可以將掃描的PDF轉換為可搜索的文本，提升工作和學習效率。

#OCR技术#可搜索文本#扫描PDF转换

2024/06/06

leqi.ai

如何將掃描PDF轉換為可搜索文本以提升工作效率

#OCR技术#可搜索文本#扫描PDF转换

2024/06/06

leqi.ai

瞭解如何將掃描的PDF轉換為可搜索的文本

在本文中，我們將瞭解如何將掃描的PDF轉換為可搜索文本，並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。

#PDF#pdftopdf#OCR

2024/06/04

leqi.ai

瞭解如何將掃描的PDF轉換為可搜索的文本

在本文中，我們將瞭解如何將掃描的PDF轉換為可搜索文本，並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。

#PDF#pdftopdf#OCR

2024/06/04

leqi.ai

提升效率：合併pdf文件的五個處理方法

#PDF轉換#pdftopdf#pdf合并

2024/05/31

leqi.ai

提升效率：合併pdf文件的五個處理方法

#PDF轉換#pdftopdf#pdf合并

2024/05/31

leqi.ai

解決方案：高效又保持原文檔格式的PDF轉Word工具推薦

在當今數字化時代，需求日益增長。本文詳細介紹了幾種常用的PDF轉Word方法，並討論了它們的侷限性。接下來，我們將向您介紹pdftopdf.ai，一款具有先進的OCR和LLM技術，提供高效且保持原始文件格式和質量的解決方案。

#pdf#PDF轉換器#ai

2024/05/29

leqi.ai

解決方案：高效又保持原文檔格式的PDF轉Word工具推薦

#pdf#PDF轉換器#ai

2024/05/29

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News