UiPath 實作 | 七大步驟用 RPA 實現文件理解！

更新於 2024/10/09發佈於 2022/10/10閱讀時間約 8 分鐘

當你因為繁重的工作量忙得分身乏術，卻仍有不少繁瑣而重複性的文書工作需執行時，是否也曾有過以下念頭：

如果有機器人可以來幫我完成的話，那該有多好？

「文件理解」可以將我們從消磨熱情的重複性行為解放出來，將有限的專注力投入於創意發想、策略思考等面向，以下將介紹「文件理解」的定義，如何透過 UiPath 這套 RPA 軟體加以實現，並以 UiPath 2022.4.3 ver. 作為說明範例。

在開始閱讀正文之前，也別忘了先追蹤我們的臉書粉絲專頁與方格子帳號！

文件理解（Document Understanding）是什麼？

「文件理解」可以透過 RPA 工具，讓機器人模擬人類從一份數位文件的內容擷取、處理並詮釋「資料」（Raw Data），使其成為使用者所需的「資訊」（Information）。

而文件理解能透過 UiPath 等 RPA 工具實現的要件在於，我們需要將文件進行「數位化」，因此文件可以來自手寫、掃描影像或是 PDF 檔等。而相較於 anchor base 專門處理結構化資料（Structured），文件理解的強項則在於可處理半結構化資料（Semi-structured），例如發票、收據等有固定格式的文件。

一些補充
1. 結構性（Structured）：具備 key 和 value 的組合，例如 key 為「姓名」、 value 為「王O明」，這樣的資料結構常見於有固定格式的履歷當中。
2. 非結構性（Unstructured）：內容沒有統一格式，也沒有互相對應的 key 和 value，例如 e-mail 或是文章。
3. 半結構性（Semi-structured）：同時具結構性和非結構性的特徵，例如發票或收據。
4. Anchor base 是利用表格「固定欄位對應到一個固定內容」的特性，並使用定位點的方式，讓機器人得以正確辨識目標以利後續流程進行，詳細說明可以參考先前文章「透過 UiPath 實現 Excel 自動化」，裡面有實際參考範例。

以 RPA 實現文件理解的七大步驟

如果還想學習更多 UiPath 功能、實作案例並了解最新自動化趨勢，
歡迎加入「零基礎快速學習 RPA－利用 UiPath 建構自動化機器人」線上課程！課程優惠只到 2024 年 2 月 5 日，快點擊連結立即了解：https://mastertalks.tw/products/rpa-uipath?ref=RPARPA

Step1：建立分類系統（Create and load taxonomy）

Taxonomy 是生物領域中專門用於分類樹上的英文詞彙，從這個詞彙進行概念延伸，此一步驟是要先定義（Define）文件理解需要分類成幾個單位，每個單位有哪些文件，進而判斷需要判讀的文件應該啟動哪個流程。

Step2：文件數位化（Digitization）【須批次處理】

此一步驟就是將文件轉化為 UiPath 可讀取的（Readable）的數位檔案，如果要使用文件辨識技術（OCR）進行轉化，則需要先安裝 Omnipackage（也就是OCR engines），如果要讀取的文件就是數位資料的話，則可以略過這個步驟。

Step3：文件分類（Classification）【須批次處理】

在這個步驟，我們需要將已經數位化的資料或檔案分類至 Step1 建立的 Taxonomy 類別中，可以使用 UiPath 的「classify document scope」功能。

Step4：擷取資訊（Extraction）【須批次處理】

顧名思義，我們要在這個階段擷取出數位檔案中的關鍵字，來協助電腦辨別這份文件是屬於哪個類別，當關鍵字設定得越精確，分類效果越佳。而 UiPath 提供三種 Extraction 的概念可以設定（config），包括 Form based、ML based、Regex based，後續的文章會再詳細說明如何設定。

Step5：驗證資訊（Validation）

此一步驟是為了確認文件分類的正確與否，當我們發現分類效果並沒有達到可以接受的程度時，就需要回到上一個步驟，重新評估是否有更好的關鍵字設定。一旦確認先前的設定足以應付文件分類後，Step5 將不會出現在正式執行機器人的流程當中，而只屬於流程設計中的其中一個過程而已。

Step6：輸出資訊（Export）

文件理解的主要用途，在於協助使用者擷取出大量電子的檔案中的所需資訊，因此這一個步驟將會視使用者所處的個別情況，並搭配不同功能設計以達成流程優化的需求。

Step7：訓練（Train）

Step4 中提到擷取文件資訊的方式有三種選擇，我們可以在流程設計中同時選擇使用這三種方式，例如人力資源部門的文件使用 ML based 的效果最佳，那麽只要在第三步驟被判斷為人力資源部門的文件，後續步驟中就可使用 ML based，同理也可運用於其他部門的文件當中。而為了評估個別文件最適合哪一種資訊擷取方式，我們需要使用現有檔案訓練 RPA 機器人，以提升機器人判斷準確率。

補充：
近年來機器學習應用蔚為風潮，應用範疇更是包羅萬象，其中在進行機器學習演算法的設計時，主要會分成以下三種類型：
1. Train：是用來設計並訓練機器學習模型
2. Validation：是用已知答案的資料去驗證此一模型的效果好壞
3. Testing：則會使用（模型未看過的）全新資料提供模型進行辨識與分類，這些資料又被稱為「測試資料（Testing Data）」。
而Step5就和機器學習的「Validation」步驟雷同，既然我們已知文件是收據還是發票，就可以用來測試此一流程是否能正確區分兩者差異，再反覆微調前面所設定的關鍵字或其他屬性以提升辨識效果。

文件理解中的「批次流程」

「批次處理」是頗常見的應用場景，由於需分類的文件往往超過個位數，才有仰賴 RPA 進行自動化流程之必要，而當我們看到批次流程設計時，就一定會使用到「for each」功能（迴圈概念），大方向是將 Step2 到 Step4 放在 for each 的迴圈當中使機器人重複執行，實際範例也會在後續文章進行說明。

總結

這篇文章初步介紹了「文件理解」的基本概念、使用情境以及主要步驟，下一篇文章將會就 RPA 流程開發時的操作細節進行分享。而我們花了這麼多時間設計一套 RPA 流程，無非就是希望能快速而精確地進行大量文書處理，因此 RPAI 數位優化器後續也會撰文分享如何設計「批次處理」流程，那我們就下篇文章見囉！

讓我們一起由簡單開始，成就不簡單！

如果你／妳喜歡這篇文章，歡迎點點愛心或留言，讓我們相互交流和成長！
這次的分享到此告一段落，想了解更多 RPA + AI 與數位轉型的最新趨勢與觀點、RPA 軟體功能介紹及實務應用案例，也歡迎追蹤 RPAI 數位優化器的社群和我們交流互動，我們下次見！
🚀 Instagram：RPAI 數位優化器
🚀 臉書粉絲專頁：RPAI 數位優化器
🚀 YouTube 頻道：RPAI 數位優化器