🤖 用 RAG + Multi-Agent + Docker 打造會自己協作的智能文件助理

更新 發佈閱讀 4 分鐘

你有沒有遇過這樣的情況:打開一份上百頁的 PDF 文件,只是為了找一個小小的答案,結果花了半小時還翻不到重點?

我常常在讀技術文件或研究資料時,都遇到這種麻煩,於是我開始想:能不能做一個「文件助理」,讓我可以直接問它問題,它會自動在文件裡找到相關內容,再用 AI 幫我整理答案?

就這樣,我設計並實作了一個專案:RAG × Multi-Agent 文件助理。它能支援 PDF 與 Markdown 檔案,具備自我協作的能力,並且可以在本地一鍵部署, 這篇文章我會分享這個專案是怎麼設計出來的,以及其中一些有趣的技術細節。

為什麼要做這個專案?

這個想法一開始很單純: 我想要一個能「直接回答文件問題」的工具。

後來我發現,光靠一個 LLM 其實效果不佳,需要加上「檢索」與「多代理協作」,才能讓答案更可靠, 於是這個專案就誕生了, 我們除了找答案之外, 更要智能化, 關鍵就在於RAG與Multi-Agent 多代理架構。

• RAG(Retrieval-Augmented Generation)檢索增強生成:讓 AI 在回答前,先去文件裡找相關段落,再生成答案。

• Multi-Agent 多代理架構:把任務拆分成不同「小助手」,例如有人專門讀文件、有人專門檢索、有人專門回答,最後一起協作完成工作。


這樣設計出來的系統,答案品質會更高,而且更容易擴展。


🛠 系統設計與架構

這個系統分成幾個核心模組:

• 文件載入(Data Loader Agent):支援 PDF 和 Markdown,先把文件切片、清理。

• 索引與檢索(LlamaIndex + FAISS):建立向量索引,就像「圖書館的索引卡」,快速找到相關段落。

• 問答生成(QA Agent):根據檢索到的內容,生成最終回答。

• 多代理協作(AutoGen):讓不同 Agent 能互相對話、協同完成任務。

• 模型管理(Ollama):在本地環境跑大模型,不需要把資料送到雲端。

• 使用介面(Streamlit):提供簡單的 Web 聊天框,直接上傳文件、提問。

• 部署(Docker Compose):一鍵啟動整套服務,方便快速體驗。

raw-image


⚡ 快速上手

我希望這個專案「簡單到人人都能試」, 不過會有點工程技術, 需要先請您安裝docker, 如果您還不知道什麼是Docker的話, 歡迎參考:「【Docker 容器化】初探微服務時代的虛擬化技術

只要四步驟:

git clone https://github.com/weihanchen/rag-multiagent-qa

# 建置服務
docker compose build

# 啟動服務
docker compose up -d

# 下載模型
docker exec rag-ollama ollama pull llama2:7b



啟動服務後,打開瀏覽器 http://localhost:8501 ,就能上傳文件,開始問答。

raw-image


🤔 開發心得與技術選擇

在開發過程中,我遇到一些挑戰,也做了幾個技術選擇:

• 為什麼選 AutoGen?

• 為什麼用 FAISS?

• 為什麼要本地部署?

• 最大的挑戰?

這些問題解決後,系統的體驗大幅提升。

🎯 結語

對我來說,這個專案不只是技術實驗,更是一個能解決日常痛點的小幫手。

如果你也常常需要翻厚厚的文件,不妨試試這個「能自己協作的文件助理」。

👉 專案 GitHub 連結

我也很好奇:如果你有這樣的 AI 助理,你會最想用它來幫忙做什麼? 歡迎下方留言告訴我!


留言
avatar-img
阿Han的沙龍
150會員
323內容數
哈囉,我是阿Han,是一位 👩‍💻 軟體研發工程師,喜歡閱讀、學習、撰寫文章及教學,擅長以圖代文,化繁為簡,除了幫助自己釐清思路之外,也希望藉由圖解的方式幫助大家共同學習,甚至手把手帶您設計出高品質的軟體產品。
阿Han的沙龍的其他內容
2025/07/02
🧵 一個小故事 在某個星期六的清晨,工程師小明被監控的訊息吵醒, Airflow 上的任務居然跑了 16 個小時還沒結束! 原來是某支資料轉換腳本卡在網路重連邏輯中,無限重試,一路跑進週末。 這時候小明邊泡咖啡邊想: 「要是早點加上 timeout,就不用週末加班了...」。 🧠 為什麼
Thumbnail
2025/07/02
🧵 一個小故事 在某個星期六的清晨,工程師小明被監控的訊息吵醒, Airflow 上的任務居然跑了 16 個小時還沒結束! 原來是某支資料轉換腳本卡在網路重連邏輯中,無限重試,一路跑進週末。 這時候小明邊泡咖啡邊想: 「要是早點加上 timeout,就不用週末加班了...」。 🧠 為什麼
Thumbnail
2025/06/18
Common Voice 是 Mozilla 發起的一個開源專案,目的是建立一個大型、公開、自由可用的語音資料庫,讓任何人(尤其是研究人員、開發者、公司)都可以用來訓練語音辨識、語音合成(TTS)等人工智慧應用。 很幸運的, Common Voice也將原始碼提供給大家使用, 在 🔍 h
Thumbnail
2025/06/18
Common Voice 是 Mozilla 發起的一個開源專案,目的是建立一個大型、公開、自由可用的語音資料庫,讓任何人(尤其是研究人員、開發者、公司)都可以用來訓練語音辨識、語音合成(TTS)等人工智慧應用。 很幸運的, Common Voice也將原始碼提供給大家使用, 在 🔍 h
Thumbnail
2025/06/11
關於Airflow是什麼, 歡迎參考「🔒 阿Han的軟體心法實戰營 - MLOps」, 在開始之前我們也推薦以下兩篇給您閱讀: 【🔒 MLOps - Airflow】使用docker compose架設Airflow 【🔒 MLOps - Airflow】使用DAG流程呼叫Docker O
Thumbnail
2025/06/11
關於Airflow是什麼, 歡迎參考「🔒 阿Han的軟體心法實戰營 - MLOps」, 在開始之前我們也推薦以下兩篇給您閱讀: 【🔒 MLOps - Airflow】使用docker compose架設Airflow 【🔒 MLOps - Airflow】使用DAG流程呼叫Docker O
Thumbnail
看更多
你可能也想看
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
Introduction AI PDF editors not only enhance efficiency but also bring a more intelligent and convenient user experience.
Thumbnail
Introduction AI PDF editors not only enhance efficiency but also bring a more intelligent and convenient user experience.
Thumbnail
這篇文章描述作者如何利用 AI 技術(如 ChatGPT)來輔助撰寫文章的過程。作者詳細拆解了自己的寫作流程,並闡述了每個環節中如何使用 AI 來提高效率。文章強調 AI 在工作流程中所帶來的改變,並指出要適應這種改變需要一定的時間和練習。
Thumbnail
這篇文章描述作者如何利用 AI 技術(如 ChatGPT)來輔助撰寫文章的過程。作者詳細拆解了自己的寫作流程,並闡述了每個環節中如何使用 AI 來提高效率。文章強調 AI 在工作流程中所帶來的改變,並指出要適應這種改變需要一定的時間和練習。
Thumbnail
本文介紹了AI科研文獻管理工具,包括Connected Papers、EasyScholar、Research Rabbit、ReadPaper、立理 LitLit、海鯨AI學術、pdftopdf.ai等。這些工具能幫助科研人員實現高效的文獻管理和利用文獻資源,並提高科研工作的效率和質量。
Thumbnail
本文介紹了AI科研文獻管理工具,包括Connected Papers、EasyScholar、Research Rabbit、ReadPaper、立理 LitLit、海鯨AI學術、pdftopdf.ai等。這些工具能幫助科研人員實現高效的文獻管理和利用文獻資源,並提高科研工作的效率和質量。
Thumbnail
在數字化時代,PDF文件廣泛使用,但傳統處理方式顯得力不從心。本文推薦pdftopdf.ai等工具,通過OCR識別,將圖片中的文字轉化為可編輯、可搜索的文本。探討PDF文檔分析的AI工具,功能和價格。描述其用途以解決掃描件中文字無法直接搜索的困擾,提高工作效率。
Thumbnail
在數字化時代,PDF文件廣泛使用,但傳統處理方式顯得力不從心。本文推薦pdftopdf.ai等工具,通過OCR識別,將圖片中的文字轉化為可編輯、可搜索的文本。探討PDF文檔分析的AI工具,功能和價格。描述其用途以解決掃描件中文字無法直接搜索的困擾,提高工作效率。
Thumbnail
學習如何將掃描的PDF轉換為可搜索文本,並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。
Thumbnail
學習如何將掃描的PDF轉換為可搜索文本,並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。
Thumbnail
在信息化時代,PDF文件無處不在。無論是學術研究、商業文件還是個人檔案,PDF都已成為最常見的文檔格式。然而,許多PDF文件是通過掃描紙質文檔生成的,這些文件中的文字無法直接編輯或複製。借助先進的OCR技術,使用者可以將掃描的PDF轉換為可搜索的文本,提升工作和學習效率。
Thumbnail
在信息化時代,PDF文件無處不在。無論是學術研究、商業文件還是個人檔案,PDF都已成為最常見的文檔格式。然而,許多PDF文件是通過掃描紙質文檔生成的,這些文件中的文字無法直接編輯或複製。借助先進的OCR技術,使用者可以將掃描的PDF轉換為可搜索的文本,提升工作和學習效率。
Thumbnail
在本文中,我們將瞭解如何將掃描的PDF轉換為可搜索文本,並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。
Thumbnail
在本文中,我們將瞭解如何將掃描的PDF轉換為可搜索文本,並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。
Thumbnail
在當今數字化時代,需求日益增長。本文詳細介紹了幾種常用的PDF轉Word方法,並討論了它們的侷限性。接下來,我們將向您介紹pdftopdf.ai,一款具有先進的OCR和LLM技術,提供高效且保持原始文件格式和質量的解決方案。
Thumbnail
在當今數字化時代,需求日益增長。本文詳細介紹了幾種常用的PDF轉Word方法,並討論了它們的侷限性。接下來,我們將向您介紹pdftopdf.ai,一款具有先進的OCR和LLM技術,提供高效且保持原始文件格式和質量的解決方案。
Thumbnail
在數位辦公環境中,PDF文件是日常工作不可或缺的一部分。pdftopdf.ai是一款強大的PDF編輯工具,可以壓縮文件,讓PDF文件更易編輯和管理。本文將探討PDF編輯工具的功能、優勢及在不同場景中的應用。
Thumbnail
在數位辦公環境中,PDF文件是日常工作不可或缺的一部分。pdftopdf.ai是一款強大的PDF編輯工具,可以壓縮文件,讓PDF文件更易編輯和管理。本文將探討PDF編輯工具的功能、優勢及在不同場景中的應用。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News