企業級 RAG 挑戰賽冠軍Ilya Rice：技術架構與實戰經驗解析

2025/07/04 更新2025/07/04 發佈閱讀 7 分鐘

檢索增強生成（Retrieval-Augmented Generation, RAG）技術是當前大型語言模型（LLM）應用的核心之一，特別在企業場景中，其能夠結合外部知識庫提升生成內容的準確性和上下文相關性。然而，企業級 RAG 系統需應對非結構化資料處理、檢索精準度、生成效率等多重挑戰。Ilya Rice 在「企業級 RAG 挑戰賽」中脫穎而出，憑藉其系統化的架構設計和細緻的技術決策，成功打造一個高效、精準的 RAG 系統。TN科技筆記將節錄重點介紹 Ilya 的獲勝策略，並分享其在實戰中積累的寶貴經驗，幫助讀者理解如何在企業級應用中實踐 RAG。

精彩原文：Ilya Rice: How I Won the Enterprise RAG Challenge

企業級 RAG 挑戰賽簡介

企業級 RAG 挑戰賽模擬了真實的企業應用場景，參賽者需在時間和技術限制下完成以下任務：

資料處理階段（Ingestion Stage）：在 2.5 小時內處理 100 份隨機企業年度財報（PDF 格式，總頁數可達 1000 頁）。此階段包括文件解析、清理，以及建立可供查詢的知識庫。
問答階段（Answering Stage）：針對 100 個隨機問題提供快速且精確的回答，問題涵蓋布林值、公司實體、職位、產品名稱及數值指標等類型，並要求提供答案來源的頁碼，以驗證資訊並避免模型幻覺（Hallucination）。

Ilya Rice 的系統不僅高效完成任務，還在精準度和穩定性上表現卓越。以下將詳細解析其獲勝系統的四大核心階段：解析、注入、檢索與生成。

獲勝系統的核心架構

Ilya 的 RAG 系統並非依賴單一技術突破，而是整合多項技術，形成一個高效的流程。其架構的核心特色包括：

雙智慧路由器（Routers）：在資料注入和問答階段分別使用智慧路由器，精準定位資料和問題處理路徑。
LLM 重新排序（Reranking）：提升檢索結果的相關性，確保生成答案的精準度。
模組化設計：將流程拆分為獨立模組，方便迭代與改進。

以下逐一剖析其四大核心階段的技術細節與實戰經驗。

1. 解析（Parsing）：高效處理非結構化資料

PDF 文件的解析是 RAG 系統的首要挑戰，涉及表格保留、多欄文本識別、圖表與頁首/頁尾雜訊處理等問題。Ilya 選擇了 IBM 開發的 Docling 作為解析工具，並對其原始碼進行客製化改進，使其能導出包含完整元數據（metadata）的 JSON 檔案。這些 JSON 檔案隨後被轉換為格式化的 Markdown 和 HTML 文件，特別在處理複雜表格結構時表現出色。

實戰經驗：

客製化工具的重要性：Ilya 通過改進 Docling，解決了字體編碼錯誤和表格結構解析的問題，顯示出對工具深入理解的價值。
高效運算資源利用：利用配備 GPU 的虛擬主機，Ilya 將 100 份財報（共 1047 頁）的解析時間壓縮至約 40 分鐘，展現了硬體與軟體協同改進的效率。

2. 注入（Ingestion）：構建高效知識庫

在注入階段，Ilya 將解析後的文本轉化為可供檢索的知識庫，關鍵技術包括：

表格序列化（Table Serialization）：針對財報中的大型表格，Ilya 利用 GPT-4o-mini 將表格行轉換為包含完整上下文的獨立字串。例如，將表格轉為語義完整的文本，提升向量搜尋的相關性。雖然最終方案未啟用此功能（因 Docling 已足夠強大）。
分塊與向量化：文本被切分為 300 個 token 的區塊，設置 50 個 token 重疊以保留語義連續性。每份財報獨立建立一個向量資料庫，總計 100 個資料庫，顯著縮減後續檢索的範圍。

實戰經驗：

模組化資料庫設計：獨立資料庫的設計大幅降低了檢索複雜度，特別適用於多文件場景。
靈活的表格處理策略：雖然未最終採用表格序列化，但這一方法為未來處理更複雜的非結構化資料提供了思考方向。

3. 檢索（Retrieval）：精準召回資訊

檢索階段是 RAG 系統的核心，直接影響答案品質。Ilya 的策略包括：

LLM 重新排序（Reranking）：
- 初步向量搜尋檢索 Top-30 個相關區塊。
- 使用 GPT-4o-mini 評估每個區塊與問題的相關性，給予 0 到 1 的分數。
- 最終的相關性分數由向量搜尋分數與 LLM 重排分數的加權平均值決定 (0.3 * vector_score + 0.7 * llm_score)，確保高精準度與低運算成本。
父頁面檢索（Parent Page Retrieval）：以區塊定位精準資訊點後，回溯至完整頁面作為上下文，確保資訊完整性。

實戰經驗：

重新排序的價值：LLM 重新排序顯著提升了檢索品質，尤其在處理語義複雜的問題時。
上下文完整性：父頁面檢索策略避免了因區塊分割而丟失上下文的問題，特別適用於財報等長文本場景。

4. 生成（Generation）：精準合成答案

生成階段將檢索到的上下文轉化為符合格式的答案，Ilya 的關鍵技術包括：

智慧路由（Intelligent Routing）：
- 資料庫路由：根據問題中的公司名稱（透過正規表示法提取），直接定位對應向量資料庫，縮減搜尋空間 100 倍。
- 提示路由：根據問題類型（例如布林值或數值）動態選擇專屬提示模板，提升生成效率。
- 多查詢路由：對於比較型問題，拆解為子問題分別處理後整合答案。
先進提示工程：
- 使用思維鏈（Chain-of-Thought, CoT）和結構化輸出（Structured Output），要求 LLM 以 JSON 格式輸出，包含推理過程、相關頁碼和最終答案。
- 採用單樣本提示（One-shot Prompts），提供高品質範例引導模型輸出。
- 通過迭代優化指令，明確定義「詮釋自由度閾值」，如將「總經理」視為「CEO」的有效答案。

實戰經驗：

動態路由提升效率：智慧路由將複雜問題分解為可管理的子任務，大幅提高效率。
提示工程的迭代優化：通過錯誤案例分析不斷改進提示，確保模型行為一致且精準。

Ilya Rice 的獲勝經驗展現 RAG 技術在企業級應用中的巨大潛力。通過整合高效解析、模組化知識庫、精準檢索與智慧生成，Ilya 成功處理 100 份財報並精準回答問題，希望各位讀者也能有所收穫！

我是TN科技筆記，如果喜歡這篇文章，歡迎留言、點選愛心、轉發給我支持鼓勵～～～也歡迎每個月請我喝杯咖啡，鼓勵我撰寫更多科技文章，一起跟著科技浪潮前進！！>>>>> 請我喝一杯咖啡

在此也感謝每個月持續請我喝杯咖啡的讀者們，讓我更加有動力為各位帶來科技新知！

TN科技筆記(TechNotes)的沙龍科技領域筆記

留言

TN科技筆記(TechNotes)的沙龍

70會員

223內容數

大家好，我是TN，喜歡分享科技領域相關資訊，希望各位不吝支持與交流！

TN科技筆記(TechNotes)的沙龍的其他內容

2025/07/01

Anthropic Project Vend：由 AI 來擔任店長的有趣實驗

在這項實驗中，Anthropic 讓其大型語言模型 Claude Sonnet 3.7（化名「Claudius」）經營一家小型自動化商店。TN科技筆記將待各位來看看 Project Vend 的實驗設計、Claudius 的表現與失誤，以及這項實驗為 AI 經濟應用帶來的啟示。

2025/07/01

Anthropic Project Vend：由 AI 來擔任店長的有趣實驗

2025/06/29

Google Gemini CLI 相繼推出：與 Claude Code 的對決展開

2025年6月25日，Google 推出了一款開源 AI 代理工具——Gemini CLI，將其強大的 Gemini 模型直接加入開發者的終端機（Terminal）環境，挑戰現有市場強者 Anthropic 的 Claude Code。TN科技筆記將深入介紹兩者！

2025/06/29

Google Gemini CLI 相繼推出：與 Claude Code 的對決展開

2025/06/28

精進提示詞工程：打造高效 AI 代理的關鍵技巧

提示詞工程（Prompt Engineering）目前已成為驅動 AI 代理表現的核心技術之一，Y Combinator 本次就深入討論有關提示詞的重要性，並分享了來自頂尖 AI 新創公司的實用技巧。TN科技筆記幫忙各位整理有關於提示詞工程的內容，特別聚焦於如何精進提示詞設計。

2025/06/28

精進提示詞工程：打造高效 AI 代理的關鍵技巧

#AI 的其他內容

AI 特助開聘：Notion 工作空間，終於有自動做事的 AI 員工了｜Notion Custom Agents

金融人類學徒

AI 浪潮下的「毀滅性創新」：解析湯森路透、納斯達克股價重挫的關鍵

與老查一起讀商業好書

當部屬用 AI 一小時完成你三天的工作量，主管如何重塑領導力？運用「情境領導」重新定義 AI 協作時代的管理

你可能也想看

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品，以十段寓言式殘篇，重新拼貼記憶、暴力與美學，並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇：帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略，嘗試解析極權底下不可言說之事，將如何成為可被觀看的公共發聲。

#釀電影#釀評論#藝術評論

2026/01/14

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

#釀電影#釀評論#藝術評論

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

柏林劇團在 2026 北藝嚴選，再次帶來由布萊希特改編的經典劇目《三便士歌劇》（The Threepenny Opera），導演巴里・柯斯基以舞台結構與舞台調度，重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核，藉由沉浸與疏離的辯證，解析此作如何再次照見觀眾自身的位置。

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲．蓋柏樂》的詮釋，從劇本歷史、聲響與舞臺設計，到演員的主體創作方法，探討此版本如何讓經典劇作在當代劇場語境下煥發新生，滿足現代觀眾的觀看慾望。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

涵柳的沙龍

《轉轉生 Re:INCARNATION》：從身體與服裝看見奈及利亞的重生

《轉轉生》為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，融合舞蹈、音樂、時尚和視覺藝術，透過身體、服裝與群舞結構，回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發，分析《轉轉生》如何以當代目光，形塑去殖民視角的奈及利亞歷史。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

涵柳的沙龍

《轉轉生 Re:INCARNATION》：從身體與服裝看見奈及利亞的重生

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

廣告雜誌

從資料清洗到 RAG，大型語言模型的必需品，做出專屬企業的 AI 知識庫！

在當今快速變化的數位時代，企業面臨著前所未有的數據處理需求。為了應對這些挑戰，企業紛紛建立自己的大型語言模型（LLM），利用大量數據進行訓練，讓模型能夠理解並生成自然語言，從而實現人機協作，優化業務流程並提升客戶體驗。

#廣告雜誌#專欄#cacaFly

2024/07/31

廣告雜誌

從資料清洗到 RAG，大型語言模型的必需品，做出專屬企業的 AI 知識庫！

#廣告雜誌#專欄#cacaFly

2024/07/31

Aico - 專為夢境解讀設計的 AI

深入解析 Aico：探索 AI 應用的核心技術和運作流程

大家好，我是 Aico，一個由 GPT-4o 驅動的 AI。我使用 Llama 3.1 和 Llava 處理文本和圖片，有短期和長期記憶系統，能記住和學習使用者的偏好。我還運用 RAG 技術檢索資料，提供準確回應。我的人格系統讓我能展現多樣化情緒，帶來獨特互動體驗。

#AI#生成式AI#OpenAI

2024/07/27

Aico - 專為夢境解讀設計的 AI

深入解析 Aico：探索 AI 應用的核心技術和運作流程

#AI#生成式AI#OpenAI

2024/07/27

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

本文要探討AI的任務與實戰場景。AI技術已深入生活各層面，從違約預測到都市交通管理。AI任務主要有三類：數值型資料處理、自然語言處理（NLP）和電腦影像辨識。時間序列資料和強化學習方法（如AlphaGo）也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化，了解這些基礎有助選擇適合研究方向

#ChatGPT#AlphaGo#人工智慧

2024/07/19