《AI-900》文件智慧服務 Document intelligence (含實作範例)

更新 發佈閱讀 6 分鐘
raw-image

本文章Microsoft 對應網頁:中文英文

文件智慧 心智圖(自製)

文件智慧 心智圖(自製)

簡介

文件智慧是建立在機器學習模型上的技術,這些模型經過訓練,能夠辨識文件中的資料,自動從影像和 PDF 讀取資料和資訊。諸如文字擷取、版面解析(layout)、鍵值對擷取,統稱為文件分析(Document Analysis)。

鍵值對擷取key-value pairs

  1. 以紙本收據的照片為例,收據上的資訊「123 Main Street」會被擷取為一組鍵值對
    Key(欄位名稱):address(地址)Value(欄位值):123 Main Street
  2. 系統也會記錄這段文字在文件中的位置,例如邊界框座標(bounding box coordinates): 
    [4.1, 2.2], [4.3, 2.2], [4.3, 2.4], [4.1, 2.4]
  3. 機器學習模型能夠根據這些座標與對應文字學習如何辨識表格或文件中的資料模式,進而達成結構化擷取。

自動化文件分析

  1. 優點:加快作業流程、改善顧客體驗、提升決策效率、減少人工輸入錯誤。
  2. 挑戰:文件與表單的格式多變
    有時可以用 預建模型(prebuilt models),這些模型以針對常見文件訓練好了,若是特殊表單,就需要訓練客製化模型。

Azure AI文件智慧服務功能 Azure AI Document Intelligence 

Azure AI文件智慧服務包含以下功能:

  1. 文件分析 Document analysis:一般的文件結構化分析,輸出包含重點區域(region of interest)與其關聯關係的資料表示方式。
  2. 預設模型 Prebuilt models:已訓練完成的模型,可處理常見文件,如發票、名片、身分證
  3. 自訂義模型 Custom models:針對現有預建模型未涵蓋的欄位進行訓練與客製化。包含自訂分類模型、文件欄位擷取模型(如Custom Generative AI Model, custom neural model.)

預設模型Prebuilt models

  1. 預設模型可以辨識與擷取文件中的文字、鍵值對、表格、結構資訊。
  2. 支援文件類型包含財務與法律文件,如美國的稅務文件、房貸文件、銷售發票、商務合約等等。
  3. 以收據模型為例,該模型可以辨識各種收據,如熱感紙收據、加油站發票、信用卡簽單等等,且支援多種語言。
    辨識欄位包含:商家姓名/地址/電話、日期、購買品名/金額/數量、總金額、稅額每個辨識的資料組會包含信賴分數(confidence score),表示擷取結果的可信度。
預設收據模型

預設收據模型

預設名片模型

預設名片模型

如何使用 Azure AI Document Intelligence?

  1. 在 Azure 訂閱 Document Intelligence 或 Azure AI Services 。
    若是第一次使用建議選擇免費層Free tier (限制PDF 或 TIFF 文件最多處理前兩頁)
  2. 建立完成後可從Document Intelligence Studio或從Azure AI Foundry 入口網站使用文件智慧服務。

練習 - 從Azure AI Foundry 入口網站中的文件擷取數據

https://microsoftlearning.github.io/mslearn-ai-fundamentals/Instructions/Labs/10-document-intelligence.html

建立專案

  1. 使用微軟Azure帳號登入:https://ai.azure.com
  2. 前往 https://ai.azure.com/managementCenter/allResources
  3. 建立專案
    (1)點選Create new,點選建立Azure AI 中樞資源 (AI hub resource)
    (2)輸入專案名稱(英文或數字)
    點選進階選項,設定區域為以下任一:
    East US
    France Central
    Korea Central
    West Europe
    West US
  4. 專案建立好之後,可看到總覽頁面,在左側選單中點選AI服務(AI services),在該頁面中點選視覺+文件(Vision + Document)
建立Azure AI 中樞資源

建立Azure AI 中樞資源

視覺+文件(Vision + Document)

視覺+文件(Vision + Document)

分析收據 Analyze a receipt

  1. 在視覺+文件頁面下方選擇分頁文件Document→收據Receipt
  2. 下載另存此張範例收據
  3. 拖曳收據圖片檔案到上傳欄位,並點擊Run analysis
    當分析完成後,系統會回傳結果。可看到服務已成功辨識出特定的資料欄位。在每個欄位旁邊會顯示百分比機率,表示該欄位預測為正確的信心程度。
文件Document→收據Receipt

文件Document→收據Receipt

收據分析結果

收據分析結果

清除資料

  1. 當不再使用此功能時,記得刪除資源,以避免產生費用。
  2. 開啟Azure Portal,登入後,選擇下方的資源群組,點擊剛剛建立的資源名稱,點選「刪除資源群組」,輸入群組名稱後確認刪除。
刪除資源群組

刪除資源群組


留言
avatar-img
留言分享你的想法!
avatar-img
快半拍成長日誌
43會員
114內容數
快半拍是小小的進步,每天前進一點點,發現微小進步中的光芒。
快半拍成長日誌的其他內容
2025/09/27
AI900 X 心智圖 X 考題重點 自然語言處理Natural Language Processing(NLP),是訓練用來分析特定語言的AI模型,專門研究如何讓電腦理解、解釋、生成人類語言(相對於程式語言)。 本文包含Azure語言實作範例,一步步帶你玩文字分析!
Thumbnail
2025/09/27
AI900 X 心智圖 X 考題重點 自然語言處理Natural Language Processing(NLP),是訓練用來分析特定語言的AI模型,專門研究如何讓電腦理解、解釋、生成人類語言(相對於程式語言)。 本文包含Azure語言實作範例,一步步帶你玩文字分析!
Thumbnail
2025/09/24
AI900 X 電腦視覺基本概念 X 考題重點 本筆記包含:總整理心智圖、電腦視覺基本概念、考題重點,以及Azure操作練習範例。 簡介常見的電腦視覺模型原理,如卷積神經網路(CNN)、Transformer 從微軟實作範例,教你一步步用Azure玩電腦視覺。
Thumbnail
2025/09/24
AI900 X 電腦視覺基本概念 X 考題重點 本筆記包含:總整理心智圖、電腦視覺基本概念、考題重點,以及Azure操作練習範例。 簡介常見的電腦視覺模型原理,如卷積神經網路(CNN)、Transformer 從微軟實作範例,教你一步步用Azure玩電腦視覺。
Thumbnail
2025/09/21
有GPT幫忙,從完全零經驗,到成功打造「LINE 傳圖→自動寄 Gmail」的流程,中間踩過哪些坑? 這不是教學,而是一場真實的自動化實驗記錄。 如果你也好奇 AI + 自動化怎麼改變日常工作流程,來看看我這趟折磨又充滿成就感的初體驗!
Thumbnail
2025/09/21
有GPT幫忙,從完全零經驗,到成功打造「LINE 傳圖→自動寄 Gmail」的流程,中間踩過哪些坑? 這不是教學,而是一場真實的自動化實驗記錄。 如果你也好奇 AI + 自動化怎麼改變日常工作流程,來看看我這趟折磨又充滿成就感的初體驗!
Thumbnail
看更多
你可能也想看
Thumbnail
還在煩惱平凡日常該如何增添一點小驚喜嗎?全家便利商店這次聯手超萌的馬來貘,推出黑白配色的馬來貘雪糕,不僅外觀吸睛,層次豐富的雙層口味更是讓人一口接一口!本文將帶你探索馬來貘雪糕的多種創意吃法,從簡單的豆漿燕麥碗、藍莓果昔,到大人系的奇亞籽布丁下午茶,讓可愛的馬來貘陪你度過每一餐,增添生活中的小確幸!
Thumbnail
還在煩惱平凡日常該如何增添一點小驚喜嗎?全家便利商店這次聯手超萌的馬來貘,推出黑白配色的馬來貘雪糕,不僅外觀吸睛,層次豐富的雙層口味更是讓人一口接一口!本文將帶你探索馬來貘雪糕的多種創意吃法,從簡單的豆漿燕麥碗、藍莓果昔,到大人系的奇亞籽布丁下午茶,讓可愛的馬來貘陪你度過每一餐,增添生活中的小確幸!
Thumbnail
在當今快速變化的數位時代,企業面臨著前所未有的數據處理需求。為了應對這些挑戰,企業紛紛建立自己的大型語言模型(LLM),利用大量數據進行訓練,讓模型能夠理解並生成自然語言,從而實現人機協作,優化業務流程並提升客戶體驗。
Thumbnail
在當今快速變化的數位時代,企業面臨著前所未有的數據處理需求。為了應對這些挑戰,企業紛紛建立自己的大型語言模型(LLM),利用大量數據進行訓練,讓模型能夠理解並生成自然語言,從而實現人機協作,優化業務流程並提升客戶體驗。
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
14天每天超過10小時共2,700餘張圖片生成大量操作,AI繪圖用於商業製作的利與弊。
Thumbnail
14天每天超過10小時共2,700餘張圖片生成大量操作,AI繪圖用於商業製作的利與弊。
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
最近要來考證照,把準備過程跟大家分享 此處提供 Microsoft Azure AI 900 證照考古題,資料來源:https://reurl.cc/4rVvE3 哪兩個場景是自然語言處理工作負載的範例?每個正確答案都代表一個完整的解決方案。 A: 監控機器的溫度,當溫度達到特
Thumbnail
最近要來考證照,把準備過程跟大家分享 此處提供 Microsoft Azure AI 900 證照考古題,資料來源:https://reurl.cc/4rVvE3 哪兩個場景是自然語言處理工作負載的範例?每個正確答案都代表一個完整的解決方案。 A: 監控機器的溫度,當溫度達到特
Thumbnail
AnyText是一個由阿里巴巴推出的AI工具,它具有多語言支持、靈活的文字佈局、精確的文字位置控制等特點,並且包括與其他AI圖像生成工具的兼容性。本篇文章介紹了AnyText的特點、如何使用以及技術原理,並且與其他知名AI工具做了比較。最後,對AnyText未來的發展和應用做出展望。
Thumbnail
AnyText是一個由阿里巴巴推出的AI工具,它具有多語言支持、靈活的文字佈局、精確的文字位置控制等特點,並且包括與其他AI圖像生成工具的兼容性。本篇文章介紹了AnyText的特點、如何使用以及技術原理,並且與其他知名AI工具做了比較。最後,對AnyText未來的發展和應用做出展望。
Thumbnail
最近要來考證照,把準備過程跟大家分享 此處提供 Microsoft Azure AI 900 證照考古題,資料來源:https://reurl.cc/4rVvE3 一家公司僱用了一支客戶服務代理團隊為客戶提供電話和電子郵件支援。該公司開發了一個網路聊天機器人,可以自動回答常見的客戶問題。透過
Thumbnail
最近要來考證照,把準備過程跟大家分享 此處提供 Microsoft Azure AI 900 證照考古題,資料來源:https://reurl.cc/4rVvE3 一家公司僱用了一支客戶服務代理團隊為客戶提供電話和電子郵件支援。該公司開發了一個網路聊天機器人,可以自動回答常見的客戶問題。透過
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News