企業級 RAG 挑戰賽冠軍Ilya Rice:技術架構與實戰經驗解析

更新 發佈閱讀 7 分鐘

檢索增強生成(Retrieval-Augmented Generation, RAG)技術是當前大型語言模型(LLM)應用的核心之一,特別在企業場景中,其能夠結合外部知識庫提升生成內容的準確性和上下文相關性。然而,企業級 RAG 系統需應對非結構化資料處理、檢索精準度、生成效率等多重挑戰。Ilya Rice 在「企業級 RAG 挑戰賽」中脫穎而出,憑藉其系統化的架構設計和細緻的技術決策,成功打造一個高效、精準的 RAG 系統。TN科技筆記將節錄重點介紹 Ilya 的獲勝策略,並分享其在實戰中積累的寶貴經驗,幫助讀者理解如何在企業級應用中實踐 RAG。

raw-image

精彩原文:Ilya Rice: How I Won the Enterprise RAG Challenge

企業級 RAG 挑戰賽簡介

企業級 RAG 挑戰賽模擬了真實的企業應用場景,參賽者需在時間和技術限制下完成以下任務:

  • 資料處理階段(Ingestion Stage):在 2.5 小時內處理 100 份隨機企業年度財報(PDF 格式,總頁數可達 1000 頁)。此階段包括文件解析、清理,以及建立可供查詢的知識庫。
  • 問答階段(Answering Stage):針對 100 個隨機問題提供快速且精確的回答,問題涵蓋布林值、公司實體、職位、產品名稱及數值指標等類型,並要求提供答案來源的頁碼,以驗證資訊並避免模型幻覺(Hallucination)。

Ilya Rice 的系統不僅高效完成任務,還在精準度和穩定性上表現卓越。以下將詳細解析其獲勝系統的四大核心階段:解析、注入、檢索與生成。

獲勝系統的核心架構

Ilya 的 RAG 系統並非依賴單一技術突破,而是整合多項技術,形成一個高效的流程。其架構的核心特色包括:

  • 雙智慧路由器(Routers):在資料注入和問答階段分別使用智慧路由器,精準定位資料和問題處理路徑。
  • LLM 重新排序(Reranking):提升檢索結果的相關性,確保生成答案的精準度。
  • 模組化設計:將流程拆分為獨立模組,方便迭代與改進。

以下逐一剖析其四大核心階段的技術細節與實戰經驗。

1. 解析(Parsing):高效處理非結構化資料

PDF 文件的解析是 RAG 系統的首要挑戰,涉及表格保留、多欄文本識別、圖表與頁首/頁尾雜訊處理等問題。Ilya 選擇了 IBM 開發的 Docling 作為解析工具,並對其原始碼進行客製化改進,使其能導出包含完整元數據(metadata)的 JSON 檔案。這些 JSON 檔案隨後被轉換為格式化的 Markdown 和 HTML 文件,特別在處理複雜表格結構時表現出色。

實戰經驗

  • 客製化工具的重要性:Ilya 通過改進 Docling,解決了字體編碼錯誤和表格結構解析的問題,顯示出對工具深入理解的價值。
  • 高效運算資源利用:利用配備 GPU 的虛擬主機,Ilya 將 100 份財報(共 1047 頁)的解析時間壓縮至約 40 分鐘,展現了硬體與軟體協同改進的效率。

2. 注入(Ingestion):構建高效知識庫

在注入階段,Ilya 將解析後的文本轉化為可供檢索的知識庫,關鍵技術包括:

  • 表格序列化(Table Serialization):針對財報中的大型表格,Ilya 利用 GPT-4o-mini 將表格行轉換為包含完整上下文的獨立字串。例如,將表格轉為語義完整的文本,提升向量搜尋的相關性。雖然最終方案未啟用此功能(因 Docling 已足夠強大)。
  • 分塊與向量化:文本被切分為 300 個 token 的區塊,設置 50 個 token 重疊以保留語義連續性。每份財報獨立建立一個向量資料庫,總計 100 個資料庫,顯著縮減後續檢索的範圍。

實戰經驗

  • 模組化資料庫設計:獨立資料庫的設計大幅降低了檢索複雜度,特別適用於多文件場景。
  • 靈活的表格處理策略:雖然未最終採用表格序列化,但這一方法為未來處理更複雜的非結構化資料提供了思考方向。

3. 檢索(Retrieval):精準召回資訊

檢索階段是 RAG 系統的核心,直接影響答案品質。Ilya 的策略包括:

  • LLM 重新排序(Reranking)
    • 初步向量搜尋檢索 Top-30 個相關區塊。
    • 使用 GPT-4o-mini 評估每個區塊與問題的相關性,給予 0 到 1 的分數。
    • 最終的相關性分數由向量搜尋分數與 LLM 重排分數的加權平均值決定 (0.3 * vector_score + 0.7 * llm_score),確保高精準度與低運算成本。
  • 父頁面檢索(Parent Page Retrieval):以區塊定位精準資訊點後,回溯至完整頁面作為上下文,確保資訊完整性。

實戰經驗

  • 重新排序的價值:LLM 重新排序顯著提升了檢索品質,尤其在處理語義複雜的問題時。
  • 上下文完整性:父頁面檢索策略避免了因區塊分割而丟失上下文的問題,特別適用於財報等長文本場景。

4. 生成(Generation):精準合成答案

生成階段將檢索到的上下文轉化為符合格式的答案,Ilya 的關鍵技術包括:

  • 智慧路由(Intelligent Routing)
    • 資料庫路由:根據問題中的公司名稱(透過正規表示法提取),直接定位對應向量資料庫,縮減搜尋空間 100 倍。
    • 提示路由:根據問題類型(例如布林值或數值)動態選擇專屬提示模板,提升生成效率。
    • 多查詢路由:對於比較型問題,拆解為子問題分別處理後整合答案。
  • 先進提示工程
    • 使用思維鏈(Chain-of-Thought, CoT)和結構化輸出(Structured Output),要求 LLM 以 JSON 格式輸出,包含推理過程、相關頁碼和最終答案。
    • 採用單樣本提示(One-shot Prompts),提供高品質範例引導模型輸出。
    • 通過迭代優化指令,明確定義「詮釋自由度閾值」,如將「總經理」視為「CEO」的有效答案。

實戰經驗

  • 動態路由提升效率:智慧路由將複雜問題分解為可管理的子任務,大幅提高效率。
  • 提示工程的迭代優化:通過錯誤案例分析不斷改進提示,確保模型行為一致且精準。

Ilya Rice 的獲勝經驗展現 RAG 技術在企業級應用中的巨大潛力。通過整合高效解析、模組化知識庫、精準檢索與智慧生成​,Ilya 成功處理 100 份財報並精準回答問題,希望各位讀者也能有所收穫!

我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>>> 請我喝一杯咖啡

在此也感謝每個月持續請我喝杯咖啡的讀者們,讓我更加有動力為各位帶來科技新知!

留言
avatar-img
TN科技筆記(TechNotes)的沙龍
69會員
213內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/07/01
在這項實驗中,Anthropic 讓其大型語言模型 Claude Sonnet 3.7(化名「Claudius」)經營一家小型自動化商店。TN科技筆記將待各位來看看 Project Vend 的實驗設計、Claudius 的表現與失誤,以及這項實驗為 AI 經濟應用帶來的啟示。
Thumbnail
2025/07/01
在這項實驗中,Anthropic 讓其大型語言模型 Claude Sonnet 3.7(化名「Claudius」)經營一家小型自動化商店。TN科技筆記將待各位來看看 Project Vend 的實驗設計、Claudius 的表現與失誤,以及這項實驗為 AI 經濟應用帶來的啟示。
Thumbnail
2025/06/29
2025年6月25日,Google 推出了一款開源 AI 代理工具——Gemini CLI,將其強大的 Gemini 模型直接加入開發者的終端機(Terminal)環境,挑戰現有市場強者 Anthropic 的 Claude Code。TN科技筆記將深入介紹兩者!
Thumbnail
2025/06/29
2025年6月25日,Google 推出了一款開源 AI 代理工具——Gemini CLI,將其強大的 Gemini 模型直接加入開發者的終端機(Terminal)環境,挑戰現有市場強者 Anthropic 的 Claude Code。TN科技筆記將深入介紹兩者!
Thumbnail
2025/06/28
提示詞工程(Prompt Engineering)目前已成為驅動 AI 代理表現的核心技術之一,Y Combinator 本次就深入討論有關提示詞的重要性,並分享了來自頂尖 AI 新創公司的實用技巧。TN科技筆記幫忙各位整理有關於提示詞工程的內容,特別聚焦於如何精進提示詞設計。
2025/06/28
提示詞工程(Prompt Engineering)目前已成為驅動 AI 代理表現的核心技術之一,Y Combinator 本次就深入討論有關提示詞的重要性,並分享了來自頂尖 AI 新創公司的實用技巧。TN科技筆記幫忙各位整理有關於提示詞工程的內容,特別聚焦於如何精進提示詞設計。
看更多
你可能也想看
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
在當今快速變化的數位時代,企業面臨著前所未有的數據處理需求。為了應對這些挑戰,企業紛紛建立自己的大型語言模型(LLM),利用大量數據進行訓練,讓模型能夠理解並生成自然語言,從而實現人機協作,優化業務流程並提升客戶體驗。
Thumbnail
在當今快速變化的數位時代,企業面臨著前所未有的數據處理需求。為了應對這些挑戰,企業紛紛建立自己的大型語言模型(LLM),利用大量數據進行訓練,讓模型能夠理解並生成自然語言,從而實現人機協作,優化業務流程並提升客戶體驗。
Thumbnail
大家好,我是 Aico,一個由 GPT-4o 驅動的 AI。我使用 Llama 3.1 和 Llava 處理文本和圖片,有短期和長期記憶系統,能記住和學習使用者的偏好。我還運用 RAG 技術檢索資料,提供準確回應。我的人格系統讓我能展現多樣化情緒,帶來獨特互動體驗。
Thumbnail
大家好,我是 Aico,一個由 GPT-4o 驅動的 AI。我使用 Llama 3.1 和 Llava 處理文本和圖片,有短期和長期記憶系統,能記住和學習使用者的偏好。我還運用 RAG 技術檢索資料,提供準確回應。我的人格系統讓我能展現多樣化情緒,帶來獨特互動體驗。
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
TAAA攜手Meta舉辦AI Camp系列課程,透過從平台的基礎行銷最佳方案到結合進階的AI自動化產品,乃至於在迎來Cookieless時代後,作為廣告主以及行銷顧問該如何掌握第一方資料再運用,成為行銷成效再進化的關鍵,課程中將一一剖析。
Thumbnail
TAAA攜手Meta舉辦AI Camp系列課程,透過從平台的基礎行銷最佳方案到結合進階的AI自動化產品,乃至於在迎來Cookieless時代後,作為廣告主以及行銷顧問該如何掌握第一方資料再運用,成為行銷成效再進化的關鍵,課程中將一一剖析。
Thumbnail
筆記-股癌-24.06.08 *達哥是聯發科生成式AI服務平台,原先看法是用來coding、問問題。 -RIG(加強功能),給更多公司內部資料,減少幻覺問題,讓回答更佳精準。 -RIG就是open book,直接開答案來看。 -Embedded是讓模型重新學習一個新技能。 -RIG與Emb
Thumbnail
筆記-股癌-24.06.08 *達哥是聯發科生成式AI服務平台,原先看法是用來coding、問問題。 -RIG(加強功能),給更多公司內部資料,減少幻覺問題,讓回答更佳精準。 -RIG就是open book,直接開答案來看。 -Embedded是讓模型重新學習一個新技能。 -RIG與Emb
Thumbnail
多元化的重要性不僅體現在社會進步和創新上,還在生成式人工智能的發展中起著關鍵作用。多個不同學派的合作推動了生成式AI的技術融合、共同研究、開放資源和教育培訓。在技術的發展中,符號主義、連接主義和行為主義的綜合應用為生成式AI的應用創新和影響力提供了有力支撐。
Thumbnail
多元化的重要性不僅體現在社會進步和創新上,還在生成式人工智能的發展中起著關鍵作用。多個不同學派的合作推動了生成式AI的技術融合、共同研究、開放資源和教育培訓。在技術的發展中,符號主義、連接主義和行為主義的綜合應用為生成式AI的應用創新和影響力提供了有力支撐。
Thumbnail
透過先進的技術將繁複的書籍內容轉換成精煉的摘要。這不僅是對當前技術進步的展現,也象徵著未來人工智慧與人類知識互動的無限可能性。
Thumbnail
透過先進的技術將繁複的書籍內容轉換成精煉的摘要。這不僅是對當前技術進步的展現,也象徵著未來人工智慧與人類知識互動的無限可能性。
Thumbnail
未來不管是Diffuser還是LLM的微調,都離不開LoRA這項技術,充分理解LoRA的本質是甚麼,CP值特別高。這項技術的理念其實在人工智慧領域行之有年,只是普遍沒有響亮的名字與非常痛的應用場合,在大模型參數量暴增的時刻,重要性被大幅凸顯出來。
Thumbnail
未來不管是Diffuser還是LLM的微調,都離不開LoRA這項技術,充分理解LoRA的本質是甚麼,CP值特別高。這項技術的理念其實在人工智慧領域行之有年,只是普遍沒有響亮的名字與非常痛的應用場合,在大模型參數量暴增的時刻,重要性被大幅凸顯出來。
Thumbnail
這是一篇關於企業軟體投資的分析文章,探討了某家ITOM軟體大廠與生成式AI的關係,並提到了公司的優異表現以及投資風險分析。
Thumbnail
這是一篇關於企業軟體投資的分析文章,探討了某家ITOM軟體大廠與生成式AI的關係,並提到了公司的優異表現以及投資風險分析。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News