Amazon Augmented AI (Amazon A2I) 是一項 Amazon Web Services (AWS) 提供的機器學習服務,旨在簡化為機器學習模型建立人工審查工作流程的過程。
它的主要目標是幫助您輕鬆地將人類智慧 (Human Intelligence) 納入機器學習工作流程中,以改進模型的準確性,特別是在處理複雜、模糊或低置信度的預測時。
為什麼需要 Amazon A2I?
儘管機器學習模型在許多任務中表現出色,但在某些情況下,它們可能無法達到 100% 的準確性,或者會產生低置信度的預測。常見的場景包括:- 高準確度要求: 例如醫療診斷、金融交易中的詐欺偵測,即使是很小的錯誤也可能帶來嚴重後果。
- 模糊或多義的數據: 例如手寫辨識、非標準格式的文件處理、口語理解。
- 模型置信度低: 當模型對自己的預測不夠確定時,需要人類介入確認。
- 模型 Drift: 隨著時間推移,數據模式變化導致模型性能下降。
- 訓練數據的標註: 在模型訓練之前,人類需要對數據進行準確的標註。
在這些情況下,人類的專業知識和判斷力至關重要。Amazon A2I 能夠讓機器學習模型處理常規任務,而將那些模型無法自信處理的任務交給人類進行審查。
主要功能和優勢:
- 內建人類審查工作流程:
- A2I 提供預建的人類審查工作流程,適用於常見的機器學習使用案例,例如: 文件處理 (Document Processing): 審查 Amazon Textract 從文件中提取的數據。 影像和影片分析 (Image and Video Analysis): 審查 Amazon Rekognition 識別出的影像內容。 文字內容審查 (Text Moderation): 審查 Amazon Comprehend 偵測到的有害或不當內容。
- 此外,您也可以為任何自訂的機器學習模型建立人工審查工作流程。
- 與 AWS ML 服務無縫整合:
- A2I 與其他 AWS 機器學習服務深度整合,例如: Amazon Textract: 用於文件識別和數據提取。 Amazon Rekognition: 用於影像和影片分析。 Amazon Comprehend: 用於自然語言處理。 Amazon SageMaker: 用於建立、訓練和部署您自己的 ML 模型。
- 這使得將人工審查環節輕鬆地插入到現有的 ML 管道中。
- 靈活的人力選擇:
- 您可以使用多種人力來源來執行審查任務: Amazon Mechanical Turk: 針對簡單、大規模的任務,使用眾包工作者。 您自己的員工: 如果任務涉及敏感或專有數據,或需要特定領域的專業知識。 第三方供應商 (Vendor): 透過 AWS Marketplace 尋找專業的資料標註和審查服務供應商。
- 易於設定和管理:
- 您可以透過 AWS 主控台輕鬆設定人類循環 (Human Loop),定義當模型預測置信度低於某個閾值或滿足特定條件時,哪些資料應該發送給人類審查。
- 您可以為審查者設計自訂的審查界面,確保他們能有效地完成任務。
- 提高模型準確性:
- 人類審查的結果不僅用於修正當前的模型預測,還可以作為高質量的新訓練數據,用於重新訓練和改進您的機器學習模型,從而形成一個持續改進的循環。
典型使用案例:
- 文件自動化: 審查從發票、收據、表格中提取的關鍵資訊,特別是對於手寫或格式複雜的文檔。
- 內容審查: 過濾社交媒體平台上的不當內容(圖片、文字、影片),確保社群安全。
- 搜尋相關性: 人工評估搜尋結果與使用者查詢的相關性,優化搜尋引擎。
- 詐欺偵測: 對於機器學習模型標記為「可疑」的交易進行人工審查,減少誤報。
- 資料標註: 為機器學習模型的訓練準備高質量的標註數據集。
總而言之,Amazon Augmented AI 是一個關鍵服務,它將人類智慧與機器學習的規模和速度相結合,幫助企業構建更準確、更可靠、更值得信賴的 AI 應用程式。