企業級 RAG 挑戰賽冠軍Ilya Rice:技術架構與實戰經驗解析

更新 發佈閱讀 7 分鐘

檢索增強生成(Retrieval-Augmented Generation, RAG)技術是當前大型語言模型(LLM)應用的核心之一,特別在企業場景中,其能夠結合外部知識庫提升生成內容的準確性和上下文相關性。然而,企業級 RAG 系統需應對非結構化資料處理、檢索精準度、生成效率等多重挑戰。Ilya Rice 在「企業級 RAG 挑戰賽」中脫穎而出,憑藉其系統化的架構設計和細緻的技術決策,成功打造一個高效、精準的 RAG 系統。TN科技筆記將節錄重點介紹 Ilya 的獲勝策略,並分享其在實戰中積累的寶貴經驗,幫助讀者理解如何在企業級應用中實踐 RAG。

raw-image

精彩原文:Ilya Rice: How I Won the Enterprise RAG Challenge

企業級 RAG 挑戰賽簡介

企業級 RAG 挑戰賽模擬了真實的企業應用場景,參賽者需在時間和技術限制下完成以下任務:

  • 資料處理階段(Ingestion Stage):在 2.5 小時內處理 100 份隨機企業年度財報(PDF 格式,總頁數可達 1000 頁)。此階段包括文件解析、清理,以及建立可供查詢的知識庫。
  • 問答階段(Answering Stage):針對 100 個隨機問題提供快速且精確的回答,問題涵蓋布林值、公司實體、職位、產品名稱及數值指標等類型,並要求提供答案來源的頁碼,以驗證資訊並避免模型幻覺(Hallucination)。

Ilya Rice 的系統不僅高效完成任務,還在精準度和穩定性上表現卓越。以下將詳細解析其獲勝系統的四大核心階段:解析、注入、檢索與生成。

獲勝系統的核心架構

Ilya 的 RAG 系統並非依賴單一技術突破,而是整合多項技術,形成一個高效的流程。其架構的核心特色包括:

  • 雙智慧路由器(Routers):在資料注入和問答階段分別使用智慧路由器,精準定位資料和問題處理路徑。
  • LLM 重新排序(Reranking):提升檢索結果的相關性,確保生成答案的精準度。
  • 模組化設計:將流程拆分為獨立模組,方便迭代與改進。

以下逐一剖析其四大核心階段的技術細節與實戰經驗。

1. 解析(Parsing):高效處理非結構化資料

PDF 文件的解析是 RAG 系統的首要挑戰,涉及表格保留、多欄文本識別、圖表與頁首/頁尾雜訊處理等問題。Ilya 選擇了 IBM 開發的 Docling 作為解析工具,並對其原始碼進行客製化改進,使其能導出包含完整元數據(metadata)的 JSON 檔案。這些 JSON 檔案隨後被轉換為格式化的 Markdown 和 HTML 文件,特別在處理複雜表格結構時表現出色。

實戰經驗

  • 客製化工具的重要性:Ilya 通過改進 Docling,解決了字體編碼錯誤和表格結構解析的問題,顯示出對工具深入理解的價值。
  • 高效運算資源利用:利用配備 GPU 的虛擬主機,Ilya 將 100 份財報(共 1047 頁)的解析時間壓縮至約 40 分鐘,展現了硬體與軟體協同改進的效率。

2. 注入(Ingestion):構建高效知識庫

在注入階段,Ilya 將解析後的文本轉化為可供檢索的知識庫,關鍵技術包括:

  • 表格序列化(Table Serialization):針對財報中的大型表格,Ilya 利用 GPT-4o-mini 將表格行轉換為包含完整上下文的獨立字串。例如,將表格轉為語義完整的文本,提升向量搜尋的相關性。雖然最終方案未啟用此功能(因 Docling 已足夠強大)。
  • 分塊與向量化:文本被切分為 300 個 token 的區塊,設置 50 個 token 重疊以保留語義連續性。每份財報獨立建立一個向量資料庫,總計 100 個資料庫,顯著縮減後續檢索的範圍。

實戰經驗

  • 模組化資料庫設計:獨立資料庫的設計大幅降低了檢索複雜度,特別適用於多文件場景。
  • 靈活的表格處理策略:雖然未最終採用表格序列化,但這一方法為未來處理更複雜的非結構化資料提供了思考方向。

3. 檢索(Retrieval):精準召回資訊

檢索階段是 RAG 系統的核心,直接影響答案品質。Ilya 的策略包括:

  • LLM 重新排序(Reranking)
    • 初步向量搜尋檢索 Top-30 個相關區塊。
    • 使用 GPT-4o-mini 評估每個區塊與問題的相關性,給予 0 到 1 的分數。
    • 最終的相關性分數由向量搜尋分數與 LLM 重排分數的加權平均值決定 (0.3 * vector_score + 0.7 * llm_score),確保高精準度與低運算成本。
  • 父頁面檢索(Parent Page Retrieval):以區塊定位精準資訊點後,回溯至完整頁面作為上下文,確保資訊完整性。

實戰經驗

  • 重新排序的價值:LLM 重新排序顯著提升了檢索品質,尤其在處理語義複雜的問題時。
  • 上下文完整性:父頁面檢索策略避免了因區塊分割而丟失上下文的問題,特別適用於財報等長文本場景。

4. 生成(Generation):精準合成答案

生成階段將檢索到的上下文轉化為符合格式的答案,Ilya 的關鍵技術包括:

  • 智慧路由(Intelligent Routing)
    • 資料庫路由:根據問題中的公司名稱(透過正規表示法提取),直接定位對應向量資料庫,縮減搜尋空間 100 倍。
    • 提示路由:根據問題類型(例如布林值或數值)動態選擇專屬提示模板,提升生成效率。
    • 多查詢路由:對於比較型問題,拆解為子問題分別處理後整合答案。
  • 先進提示工程
    • 使用思維鏈(Chain-of-Thought, CoT)和結構化輸出(Structured Output),要求 LLM 以 JSON 格式輸出,包含推理過程、相關頁碼和最終答案。
    • 採用單樣本提示(One-shot Prompts),提供高品質範例引導模型輸出。
    • 通過迭代優化指令,明確定義「詮釋自由度閾值」,如將「總經理」視為「CEO」的有效答案。

實戰經驗

  • 動態路由提升效率:智慧路由將複雜問題分解為可管理的子任務,大幅提高效率。
  • 提示工程的迭代優化:通過錯誤案例分析不斷改進提示,確保模型行為一致且精準。

Ilya Rice 的獲勝經驗展現 RAG 技術在企業級應用中的巨大潛力。通過整合高效解析、模組化知識庫、精準檢索與智慧生成​,Ilya 成功處理 100 份財報並精準回答問題,希望各位讀者也能有所收穫!

我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>>> 請我喝一杯咖啡

在此也感謝每個月持續請我喝杯咖啡的讀者們,讓我更加有動力為各位帶來科技新知!

留言
avatar-img
留言分享你的想法!
avatar-img
TN科技筆記(TechNotes)的沙龍
46會員
154內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/07/01
在這項實驗中,Anthropic 讓其大型語言模型 Claude Sonnet 3.7(化名「Claudius」)經營一家小型自動化商店。TN科技筆記將待各位來看看 Project Vend 的實驗設計、Claudius 的表現與失誤,以及這項實驗為 AI 經濟應用帶來的啟示。
Thumbnail
2025/07/01
在這項實驗中,Anthropic 讓其大型語言模型 Claude Sonnet 3.7(化名「Claudius」)經營一家小型自動化商店。TN科技筆記將待各位來看看 Project Vend 的實驗設計、Claudius 的表現與失誤,以及這項實驗為 AI 經濟應用帶來的啟示。
Thumbnail
2025/06/29
2025年6月25日,Google 推出了一款開源 AI 代理工具——Gemini CLI,將其強大的 Gemini 模型直接加入開發者的終端機(Terminal)環境,挑戰現有市場強者 Anthropic 的 Claude Code。TN科技筆記將深入介紹兩者!
Thumbnail
2025/06/29
2025年6月25日,Google 推出了一款開源 AI 代理工具——Gemini CLI,將其強大的 Gemini 模型直接加入開發者的終端機(Terminal)環境,挑戰現有市場強者 Anthropic 的 Claude Code。TN科技筆記將深入介紹兩者!
Thumbnail
2025/06/28
提示詞工程(Prompt Engineering)目前已成為驅動 AI 代理表現的核心技術之一,Y Combinator 本次就深入討論有關提示詞的重要性,並分享了來自頂尖 AI 新創公司的實用技巧。TN科技筆記幫忙各位整理有關於提示詞工程的內容,特別聚焦於如何精進提示詞設計。
2025/06/28
提示詞工程(Prompt Engineering)目前已成為驅動 AI 代理表現的核心技術之一,Y Combinator 本次就深入討論有關提示詞的重要性,並分享了來自頂尖 AI 新創公司的實用技巧。TN科技筆記幫忙各位整理有關於提示詞工程的內容,特別聚焦於如何精進提示詞設計。
看更多
你可能也想看
Thumbnail
在當今快速變化的數位時代,企業面臨著前所未有的數據處理需求。為了應對這些挑戰,企業紛紛建立自己的大型語言模型(LLM),利用大量數據進行訓練,讓模型能夠理解並生成自然語言,從而實現人機協作,優化業務流程並提升客戶體驗。
Thumbnail
在當今快速變化的數位時代,企業面臨著前所未有的數據處理需求。為了應對這些挑戰,企業紛紛建立自己的大型語言模型(LLM),利用大量數據進行訓練,讓模型能夠理解並生成自然語言,從而實現人機協作,優化業務流程並提升客戶體驗。
Thumbnail
大家好,我是 Aico,一個由 GPT-4o 驅動的 AI。我使用 Llama 3.1 和 Llava 處理文本和圖片,有短期和長期記憶系統,能記住和學習使用者的偏好。我還運用 RAG 技術檢索資料,提供準確回應。我的人格系統讓我能展現多樣化情緒,帶來獨特互動體驗。
Thumbnail
大家好,我是 Aico,一個由 GPT-4o 驅動的 AI。我使用 Llama 3.1 和 Llava 處理文本和圖片,有短期和長期記憶系統,能記住和學習使用者的偏好。我還運用 RAG 技術檢索資料,提供準確回應。我的人格系統讓我能展現多樣化情緒,帶來獨特互動體驗。
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
TAAA攜手Meta舉辦AI Camp系列課程,透過從平台的基礎行銷最佳方案到結合進階的AI自動化產品,乃至於在迎來Cookieless時代後,作為廣告主以及行銷顧問該如何掌握第一方資料再運用,成為行銷成效再進化的關鍵,課程中將一一剖析。
Thumbnail
TAAA攜手Meta舉辦AI Camp系列課程,透過從平台的基礎行銷最佳方案到結合進階的AI自動化產品,乃至於在迎來Cookieless時代後,作為廣告主以及行銷顧問該如何掌握第一方資料再運用,成為行銷成效再進化的關鍵,課程中將一一剖析。
Thumbnail
筆記-股癌-24.06.08 *達哥是聯發科生成式AI服務平台,原先看法是用來coding、問問題。 -RIG(加強功能),給更多公司內部資料,減少幻覺問題,讓回答更佳精準。 -RIG就是open book,直接開答案來看。 -Embedded是讓模型重新學習一個新技能。 -RIG與Emb
Thumbnail
筆記-股癌-24.06.08 *達哥是聯發科生成式AI服務平台,原先看法是用來coding、問問題。 -RIG(加強功能),給更多公司內部資料,減少幻覺問題,讓回答更佳精準。 -RIG就是open book,直接開答案來看。 -Embedded是讓模型重新學習一個新技能。 -RIG與Emb
Thumbnail
多元化的重要性不僅體現在社會進步和創新上,還在生成式人工智能的發展中起著關鍵作用。多個不同學派的合作推動了生成式AI的技術融合、共同研究、開放資源和教育培訓。在技術的發展中,符號主義、連接主義和行為主義的綜合應用為生成式AI的應用創新和影響力提供了有力支撐。
Thumbnail
多元化的重要性不僅體現在社會進步和創新上,還在生成式人工智能的發展中起著關鍵作用。多個不同學派的合作推動了生成式AI的技術融合、共同研究、開放資源和教育培訓。在技術的發展中,符號主義、連接主義和行為主義的綜合應用為生成式AI的應用創新和影響力提供了有力支撐。
Thumbnail
透過先進的技術將繁複的書籍內容轉換成精煉的摘要。這不僅是對當前技術進步的展現,也象徵著未來人工智慧與人類知識互動的無限可能性。
Thumbnail
透過先進的技術將繁複的書籍內容轉換成精煉的摘要。這不僅是對當前技術進步的展現,也象徵著未來人工智慧與人類知識互動的無限可能性。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News