🤖 用 RAG + Multi-Agent + Docker 打造會自己協作的智能文件助理

更新 發佈閱讀 4 分鐘

你有沒有遇過這樣的情況:打開一份上百頁的 PDF 文件,只是為了找一個小小的答案,結果花了半小時還翻不到重點?

我常常在讀技術文件或研究資料時,都遇到這種麻煩,於是我開始想:能不能做一個「文件助理」,讓我可以直接問它問題,它會自動在文件裡找到相關內容,再用 AI 幫我整理答案?

就這樣,我設計並實作了一個專案:RAG × Multi-Agent 文件助理。它能支援 PDF 與 Markdown 檔案,具備自我協作的能力,並且可以在本地一鍵部署, 這篇文章我會分享這個專案是怎麼設計出來的,以及其中一些有趣的技術細節。

為什麼要做這個專案?

這個想法一開始很單純: 我想要一個能「直接回答文件問題」的工具。

後來我發現,光靠一個 LLM 其實效果不佳,需要加上「檢索」與「多代理協作」,才能讓答案更可靠, 於是這個專案就誕生了, 我們除了找答案之外, 更要智能化, 關鍵就在於RAG與Multi-Agent 多代理架構。

• RAG(Retrieval-Augmented Generation)檢索增強生成:讓 AI 在回答前,先去文件裡找相關段落,再生成答案。

• Multi-Agent 多代理架構:把任務拆分成不同「小助手」,例如有人專門讀文件、有人專門檢索、有人專門回答,最後一起協作完成工作。


這樣設計出來的系統,答案品質會更高,而且更容易擴展。


🛠 系統設計與架構

這個系統分成幾個核心模組:

• 文件載入(Data Loader Agent):支援 PDF 和 Markdown,先把文件切片、清理。

• 索引與檢索(LlamaIndex + FAISS):建立向量索引,就像「圖書館的索引卡」,快速找到相關段落。

• 問答生成(QA Agent):根據檢索到的內容,生成最終回答。

• 多代理協作(AutoGen):讓不同 Agent 能互相對話、協同完成任務。

• 模型管理(Ollama):在本地環境跑大模型,不需要把資料送到雲端。

• 使用介面(Streamlit):提供簡單的 Web 聊天框,直接上傳文件、提問。

• 部署(Docker Compose):一鍵啟動整套服務,方便快速體驗。

raw-image


⚡ 快速上手

我希望這個專案「簡單到人人都能試」, 不過會有點工程技術, 需要先請您安裝docker, 如果您還不知道什麼是Docker的話, 歡迎參考:「【Docker 容器化】初探微服務時代的虛擬化技術

只要四步驟:

git clone https://github.com/weihanchen/rag-multiagent-qa

# 建置服務
docker compose build

# 啟動服務
docker compose up -d

# 下載模型
docker exec rag-ollama ollama pull llama2:7b



啟動服務後,打開瀏覽器 http://localhost:8501 ,就能上傳文件,開始問答。

raw-image


🤔 開發心得與技術選擇

在開發過程中,我遇到一些挑戰,也做了幾個技術選擇:

• 為什麼選 AutoGen?

• 為什麼用 FAISS?

• 為什麼要本地部署?

• 最大的挑戰?

這些問題解決後,系統的體驗大幅提升。

🎯 結語

對我來說,這個專案不只是技術實驗,更是一個能解決日常痛點的小幫手。

如果你也常常需要翻厚厚的文件,不妨試試這個「能自己協作的文件助理」。

👉 專案 GitHub 連結

我也很好奇:如果你有這樣的 AI 助理,你會最想用它來幫忙做什麼? 歡迎下方留言告訴我!


留言
avatar-img
留言分享你的想法!
avatar-img
阿Han的沙龍
139會員
303內容數
哈囉,我是阿Han,是一位 👩‍💻 軟體研發工程師,喜歡閱讀、學習、撰寫文章及教學,擅長以圖代文,化繁為簡,除了幫助自己釐清思路之外,也希望藉由圖解的方式幫助大家共同學習,甚至手把手帶您設計出高品質的軟體產品。
阿Han的沙龍的其他內容
2025/07/02
🧵 一個小故事 在某個星期六的清晨,工程師小明被監控的訊息吵醒, Airflow 上的任務居然跑了 16 個小時還沒結束! 原來是某支資料轉換腳本卡在網路重連邏輯中,無限重試,一路跑進週末。 這時候小明邊泡咖啡邊想: 「要是早點加上 timeout,就不用週末加班了...」。 🧠 為什麼
Thumbnail
2025/07/02
🧵 一個小故事 在某個星期六的清晨,工程師小明被監控的訊息吵醒, Airflow 上的任務居然跑了 16 個小時還沒結束! 原來是某支資料轉換腳本卡在網路重連邏輯中,無限重試,一路跑進週末。 這時候小明邊泡咖啡邊想: 「要是早點加上 timeout,就不用週末加班了...」。 🧠 為什麼
Thumbnail
2025/06/18
Common Voice 是 Mozilla 發起的一個開源專案,目的是建立一個大型、公開、自由可用的語音資料庫,讓任何人(尤其是研究人員、開發者、公司)都可以用來訓練語音辨識、語音合成(TTS)等人工智慧應用。 很幸運的, Common Voice也將原始碼提供給大家使用, 在 🔍 h
Thumbnail
2025/06/18
Common Voice 是 Mozilla 發起的一個開源專案,目的是建立一個大型、公開、自由可用的語音資料庫,讓任何人(尤其是研究人員、開發者、公司)都可以用來訓練語音辨識、語音合成(TTS)等人工智慧應用。 很幸運的, Common Voice也將原始碼提供給大家使用, 在 🔍 h
Thumbnail
2025/06/11
關於Airflow是什麼, 歡迎參考「🔒 阿Han的軟體心法實戰營 - MLOps」, 在開始之前我們也推薦以下兩篇給您閱讀: 【🔒 MLOps - Airflow】使用docker compose架設Airflow 【🔒 MLOps - Airflow】使用DAG流程呼叫Docker O
Thumbnail
2025/06/11
關於Airflow是什麼, 歡迎參考「🔒 阿Han的軟體心法實戰營 - MLOps」, 在開始之前我們也推薦以下兩篇給您閱讀: 【🔒 MLOps - Airflow】使用docker compose架設Airflow 【🔒 MLOps - Airflow】使用DAG流程呼叫Docker O
Thumbnail
看更多
你可能也想看
Thumbnail
Introduction AI PDF editors not only enhance efficiency but also bring a more intelligent and convenient user experience.
Thumbnail
Introduction AI PDF editors not only enhance efficiency but also bring a more intelligent and convenient user experience.
Thumbnail
這篇文章描述作者如何利用 AI 技術(如 ChatGPT)來輔助撰寫文章的過程。作者詳細拆解了自己的寫作流程,並闡述了每個環節中如何使用 AI 來提高效率。文章強調 AI 在工作流程中所帶來的改變,並指出要適應這種改變需要一定的時間和練習。
Thumbnail
這篇文章描述作者如何利用 AI 技術(如 ChatGPT)來輔助撰寫文章的過程。作者詳細拆解了自己的寫作流程,並闡述了每個環節中如何使用 AI 來提高效率。文章強調 AI 在工作流程中所帶來的改變,並指出要適應這種改變需要一定的時間和練習。
Thumbnail
本文介紹了AI科研文獻管理工具,包括Connected Papers、EasyScholar、Research Rabbit、ReadPaper、立理 LitLit、海鯨AI學術、pdftopdf.ai等。這些工具能幫助科研人員實現高效的文獻管理和利用文獻資源,並提高科研工作的效率和質量。
Thumbnail
本文介紹了AI科研文獻管理工具,包括Connected Papers、EasyScholar、Research Rabbit、ReadPaper、立理 LitLit、海鯨AI學術、pdftopdf.ai等。這些工具能幫助科研人員實現高效的文獻管理和利用文獻資源,並提高科研工作的效率和質量。
Thumbnail
在數字化時代,PDF文件廣泛使用,但傳統處理方式顯得力不從心。本文推薦pdftopdf.ai等工具,通過OCR識別,將圖片中的文字轉化為可編輯、可搜索的文本。探討PDF文檔分析的AI工具,功能和價格。描述其用途以解決掃描件中文字無法直接搜索的困擾,提高工作效率。
Thumbnail
在數字化時代,PDF文件廣泛使用,但傳統處理方式顯得力不從心。本文推薦pdftopdf.ai等工具,通過OCR識別,將圖片中的文字轉化為可編輯、可搜索的文本。探討PDF文檔分析的AI工具,功能和價格。描述其用途以解決掃描件中文字無法直接搜索的困擾,提高工作效率。
Thumbnail
學習如何將掃描的PDF轉換為可搜索文本,並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。
Thumbnail
學習如何將掃描的PDF轉換為可搜索文本,並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。
Thumbnail
在信息化時代,PDF文件無處不在。無論是學術研究、商業文件還是個人檔案,PDF都已成為最常見的文檔格式。然而,許多PDF文件是通過掃描紙質文檔生成的,這些文件中的文字無法直接編輯或複製。借助先進的OCR技術,使用者可以將掃描的PDF轉換為可搜索的文本,提升工作和學習效率。
Thumbnail
在信息化時代,PDF文件無處不在。無論是學術研究、商業文件還是個人檔案,PDF都已成為最常見的文檔格式。然而,許多PDF文件是通過掃描紙質文檔生成的,這些文件中的文字無法直接編輯或複製。借助先進的OCR技術,使用者可以將掃描的PDF轉換為可搜索的文本,提升工作和學習效率。
Thumbnail
在本文中,我們將瞭解如何將掃描的PDF轉換為可搜索文本,並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。
Thumbnail
在本文中,我們將瞭解如何將掃描的PDF轉換為可搜索文本,並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News