UiPath 實作 | 七大步驟用 RPA 實現文件理解!

更新於 發佈於 閱讀時間約 8 分鐘

當你因為繁重的工作量忙得分身乏術,卻仍有不少繁瑣而重複性的文書工作需執行時,是否也曾有過以下念頭:

如果有機器人可以來幫我完成的話,那該有多好?

文件理解」可以將我們從消磨熱情的重複性行為解放出來,將有限的專注力投入於創意發想、策略思考等面向,以下將介紹「文件理解」的定義,如何透過 UiPath 這套 RPA 軟體加以實現,並以 UiPath 2022.4.3 ver. 作為說明範例。

raw-image
在開始閱讀正文之前,也別忘了先追蹤我們的 臉書粉絲專頁方格子帳號

文件理解(Document Understanding)是什麼?

「文件理解」可以透過 RPA 工具,讓機器人模擬人類從一份數位文件的內容擷取、處理並詮釋「資料」(Raw Data),使其成為使用者所需的「資訊」(Information)。

而文件理解能透過 UiPath 等 RPA 工具實現的要件在於,我們需要將文件進行「數位化」,因此文件可以來自手寫、掃描影像或是 PDF 檔等。而相較於 anchor base 專門處理結構化資料(Structured),文件理解的強項則在於可處理半結構化資料(Semi-structured),例如發票、收據等有固定格式的文件。

一些補充
1. 結構性(Structured):具備 key 和 value 的組合,例如 key 為「姓名」、 value 為「王O明」,這樣的資料結構常見於有固定格式的履歷當中。
2. 非結構性(Unstructured):內容沒有統一格式,也沒有互相對應的 key 和 value,例如 e-mail 或是文章。
3. 半結構性(Semi-structured):同時具結構性和非結構性的特徵,例如發票或收據。
4. Anchor base 是利用表格「固定欄位對應到一個固定內容」的特性,並使用定位點的方式,讓機器人得以正確辨識目標以利後續流程進行,詳細說明可以參考先前文章「透過 UiPath 實現 Excel 自動化」,裡面有實際參考範例。

以 RPA 實現文件理解的七大步驟

raw-image
如果還想學習更多 UiPath 功能、實作案例並了解最新自動化趨勢,
歡迎加入「零基礎快速學習 RPA-利用 UiPath 建構自動化機器人」線上課程!課程優惠只到 2024 年 2 月 5 日,快點擊連結立即了解:https://mastertalks.tw/products/rpa-uipath?ref=RPARPA

Step1:建立分類系統(Create and load taxonomy)

Taxonomy 是生物領域中專門用於分類樹上的英文詞彙,從這個詞彙進行概念延伸,此一步驟是要先定義(Define)文件理解需要分類成幾個單位,每個單位有哪些文件,進而判斷需要判讀的文件應該啟動哪個流程。

Step2:文件數位化(Digitization)【須批次處理】

此一步驟就是將文件轉化為 UiPath 可讀取的(Readable)的數位檔案,如果要使用文件辨識技術(OCR)進行轉化,則需要先安裝 Omnipackage(也就是OCR engines),如果要讀取的文件就是數位資料的話,則可以略過這個步驟

Step3:文件分類(Classification)【須批次處理】

在這個步驟,我們需要將已經數位化的資料或檔案分類至 Step1 建立的 Taxonomy 類別中,可以使用 UiPath 的「classify document scope」功能。

Step4:擷取資訊(Extraction)【須批次處理】

顧名思義,我們要在這個階段擷取出數位檔案中的關鍵字,來協助電腦辨別這份文件是屬於哪個類別,當關鍵字設定得越精確,分類效果越佳。而 UiPath 提供三種 Extraction 的概念可以設定(config),包括 Form based、ML based、Regex based,後續的文章會再詳細說明如何設定。

Step5:驗證資訊(Validation)

此一步驟是為了確認文件分類的正確與否,當我們發現分類效果並沒有達到可以接受的程度時,就需要回到上一個步驟,重新評估是否有更好的關鍵字設定。一旦確認先前的設定足以應付文件分類後,Step5 將不會出現在正式執行機器人的流程當中,而只屬於流程設計中的其中一個過程而已。

Step6:輸出資訊(Export)

文件理解的主要用途,在於協助使用者擷取出大量電子的檔案中的所需資訊,因此這一個步驟將會視使用者所處的個別情況,並搭配不同功能設計以達成流程優化的需求。

Step7:訓練(Train)

Step4 中提到擷取文件資訊的方式有三種選擇,我們可以在流程設計中同時選擇使用這三種方式,例如人力資源部門的文件使用 ML based 的效果最佳,那麽只要在第三步驟被判斷為人力資源部門的文件,後續步驟中就可使用 ML based,同理也可運用於其他部門的文件當中。而為了評估個別文件最適合哪一種資訊擷取方式,我們需要使用現有檔案訓練 RPA 機器人,以提升機器人判斷準確率。

補充:
近年來機器學習應用蔚為風潮,應用範疇更是包羅萬象,其中在進行機器學習演算法的設計時,主要會分成以下三種類型:
1. Train:是用來設計並訓練機器學習模型
2. Validation:是用已知答案的資料去驗證此一模型的效果好壞
3. Testing:則會使用(模型未看過的)全新資料提供模型進行辨識與分類,這些資料又被稱為「測試資料(Testing Data)」。
而Step5就和機器學習的「Validation」步驟雷同,既然我們已知文件是收據還是發票,就可以用來測試此一流程是否能正確區分兩者差異,再反覆微調前面所設定的關鍵字或其他屬性以提升辨識效果。

文件理解中的「批次流程」

「批次處理」是頗常見的應用場景,由於需分類的文件往往超過個位數,才有仰賴 RPA 進行自動化流程之必要,而當我們看到批次流程設計時,就一定會使用到「for each」功能(迴圈概念),大方向是將 Step2 到 Step4 放在 for each 的迴圈當中使機器人重複執行,實際範例也會在後續文章進行說明。


總結

這篇文章初步介紹了「文件理解」的基本概念、使用情境以及主要步驟,下一篇文章將會就 RPA 流程開發時的操作細節進行分享。而我們花了這麼多時間設計一套 RPA 流程,無非就是希望能快速而精確地進行大量文書處理,因此 RPAI 數位優化器後續也會撰文分享如何設計「批次處理」流程,那我們就下篇文章見囉!

讓我們一起由簡單開始,成就不簡單!
如果你/妳喜歡這篇文章,歡迎點點愛心或留言,讓我們相互交流和成長!
這次的分享到此告一段落,想了解更多 RPA + AI 與數位轉型的最新趨勢與觀點、RPA 軟體功能介紹及實務應用案例,也歡迎追蹤 RPAI 數位優化器的社群和我們交流互動,我們下次見!
🚀 Instagram:RPAI 數位優化器
🚀 臉書粉絲專頁:RPAI 數位優化器
🚀 YouTube 頻道:RPAI 數位優化器

延伸閱讀

UiPath功能介紹|For Each Row in Datatable

留言
avatar-img
留言分享你的想法!
avatar-img
RPAI 數位優化器
180會員
138內容數
我們是以「機器人流程自動化(RPA)」結合「人工智慧(AI)」為主題的中文學習社群,旨在分享 RPA + AI 的學習資源、應用實例和最新發展趨勢,讓工作者透過自動化工具的有效應用,創造數位優化與轉型契機,讓我們一起由簡單開始,成就不簡單!
RPAI 數位優化器的其他內容
2024/12/22
最近在使用UiPath的時候,發現改版新增了AI功能!它就叫作 Autopilot,藉由它的協助,可以大幅減少初學者摸索與試錯的時間,以下的舉例將結合ChatGPT以及UiPath進行開發與debug,期待透過分享,讓更多人能夠善用這些功能,提升開發的效率!
Thumbnail
2024/12/22
最近在使用UiPath的時候,發現改版新增了AI功能!它就叫作 Autopilot,藉由它的協助,可以大幅減少初學者摸索與試錯的時間,以下的舉例將結合ChatGPT以及UiPath進行開發與debug,期待透過分享,讓更多人能夠善用這些功能,提升開發的效率!
Thumbnail
2024/10/04
這篇文章提供了一個詳細的教學,指導讀者如何將 UiPath 開發的自動化流程發佈至 Orchestrator 及設定自動執行的排程。透過步驟包括登入 Orchestrator、建立資料夾、發布流程、設定預約時間等,讀者將能學會有效地管理流程和機器人,進而提升自動化效率。
Thumbnail
2024/10/04
這篇文章提供了一個詳細的教學,指導讀者如何將 UiPath 開發的自動化流程發佈至 Orchestrator 及設定自動執行的排程。透過步驟包括登入 Orchestrator、建立資料夾、發布流程、設定預約時間等,讀者將能學會有效地管理流程和機器人,進而提升自動化效率。
Thumbnail
2024/08/24
在這篇文章中,我們將深入探討如何透過 UiPath 的 Excel 相關功能來協助自動化操作,包括使用 Excel 檔案、讀取範圍、寫入單元格、篩選和插入工作表等技巧,透過具體範例,讀者將能快速上手並理解這些功能的使用方法,提升你的工作效率。
Thumbnail
2024/08/24
在這篇文章中,我們將深入探討如何透過 UiPath 的 Excel 相關功能來協助自動化操作,包括使用 Excel 檔案、讀取範圍、寫入單元格、篩選和插入工作表等技巧,透過具體範例,讀者將能快速上手並理解這些功能的使用方法,提升你的工作效率。
Thumbnail
看更多
你可能也想看
Thumbnail
RPA是什麼? 試想想,在你上班,睡覺,甚至玩樂的時候,都有一個助理機器人24小時不間斷的幫你工作。不會喊累,不會翹班,不會一直要求加薪。 你,會需要嗎? 如同掃地機器人,送餐機器人,RPA,也是一個可以協助我們的軟體機器人。
Thumbnail
RPA是什麼? 試想想,在你上班,睡覺,甚至玩樂的時候,都有一個助理機器人24小時不間斷的幫你工作。不會喊累,不會翹班,不會一直要求加薪。 你,會需要嗎? 如同掃地機器人,送餐機器人,RPA,也是一個可以協助我們的軟體機器人。
Thumbnail
從零開始學 UiPath?這篇 RPA 教學一次整理基礎操作與進階功能,幫你快速上手。無論你是新手還是想精進技能,這裡都有最實用的 UiPath 學習資源,帶你打造專屬自動化機器人,提升效率,實現工作流程數位轉型。
Thumbnail
從零開始學 UiPath?這篇 RPA 教學一次整理基礎操作與進階功能,幫你快速上手。無論你是新手還是想精進技能,這裡都有最實用的 UiPath 學習資源,帶你打造專屬自動化機器人,提升效率,實現工作流程數位轉型。
Thumbnail
通常大家聯想到 RPA,都會直覺認為其需給予明確指令和動作,本身並不具備獨立判斷的能力,因此 RPAI 數位優化器便希望透過分享這篇文章,和大家聊聊 RPA 的技術發展及該如何與人工智能協作,以及 RPA 如何在不同產品週期產生更大的效益。
Thumbnail
通常大家聯想到 RPA,都會直覺認為其需給予明確指令和動作,本身並不具備獨立判斷的能力,因此 RPAI 數位優化器便希望透過分享這篇文章,和大家聊聊 RPA 的技術發展及該如何與人工智能協作,以及 RPA 如何在不同產品週期產生更大的效益。
Thumbnail
先前 RPAI 數位優化器有分享過如何利用 UiPath Orchestrator,實現於特定時間啟動指定機器人流程的做法。不過我們怎麼可以只學一種工具呢?這次要介紹 Windows 內建的工作排程器(Task Scheduler),不需仰賴 Orchestrator 也可以將機器人流程進行排程!
Thumbnail
先前 RPAI 數位優化器有分享過如何利用 UiPath Orchestrator,實現於特定時間啟動指定機器人流程的做法。不過我們怎麼可以只學一種工具呢?這次要介紹 Windows 內建的工作排程器(Task Scheduler),不需仰賴 Orchestrator 也可以將機器人流程進行排程!
Thumbnail
你是否也曾經有過以下這個念頭:如果有機器人可以來幫我完成繁瑣而重複性文書工作的話,那該有多好?「文件理解」可將我們從消磨熱情的重複性行為解放出來,將有限的專注力投入於創意發想、策略思考等面向,以下將介紹「文件理解」的定義,以及使用 UiPath 製作文件理解機器人的七大步驟!
Thumbnail
你是否也曾經有過以下這個念頭:如果有機器人可以來幫我完成繁瑣而重複性文書工作的話,那該有多好?「文件理解」可將我們從消磨熱情的重複性行為解放出來,將有限的專注力投入於創意發想、策略思考等面向,以下將介紹「文件理解」的定義,以及使用 UiPath 製作文件理解機器人的七大步驟!
Thumbnail
即使身處在台灣,使用者也能透過這項工具,使 RPA 機器人於美國加州時區的中午 12 點自動執行任務,而不需要通宵熬夜,RPAI 數位優化器要介紹的是幫了遠端工作者大忙的功臣便是:UiPath Orchestrator 的其中一項功能,可協助使用者安排時程,去執行已經製作完成的機器人。
Thumbnail
即使身處在台灣,使用者也能透過這項工具,使 RPA 機器人於美國加州時區的中午 12 點自動執行任務,而不需要通宵熬夜,RPAI 數位優化器要介紹的是幫了遠端工作者大忙的功臣便是:UiPath Orchestrator 的其中一項功能,可協助使用者安排時程,去執行已經製作完成的機器人。
Thumbnail
機器人流程自動化(RPA)在台灣還是新興工具和概念,不過已有越來越多企業釋出相關職缺機會。如果想從事 RPA 相關工作,我們又該如何準備面試呢?RPAI 數位優化器參考了不少國外網路資源,以下分享幾個在 RPA 職缺面試時,國外應徵者經常碰到的 RPA 觀念問題:
Thumbnail
機器人流程自動化(RPA)在台灣還是新興工具和概念,不過已有越來越多企業釋出相關職缺機會。如果想從事 RPA 相關工作,我們又該如何準備面試呢?RPAI 數位優化器參考了不少國外網路資源,以下分享幾個在 RPA 職缺面試時,國外應徵者經常碰到的 RPA 觀念問題:
Thumbnail
什麼是RPA,機器人流程自動化? 你知道什麼是RPA嗎?在Wiki解釋中看不太懂,經簡化如下: 機器人流程自動化(Robotic process automation)簡稱RPA,是以軟體機器人及人工智慧(AI)為基礎的業務過程自動化科技。
Thumbnail
什麼是RPA,機器人流程自動化? 你知道什麼是RPA嗎?在Wiki解釋中看不太懂,經簡化如下: 機器人流程自動化(Robotic process automation)簡稱RPA,是以軟體機器人及人工智慧(AI)為基礎的業務過程自動化科技。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News