你是否有過使用機器學習時,卻需要人工審查的經驗呢? AWS 的 Amazon Augmented AI (Amazon A2I)是一項機器學習服務,簡化了為 ML 應用程序構建和管理人工審核的過程,讓你可以輕鬆建置人工審查所需的工作流程!
Amazon A2I 使用時機 - 由於機器學習判斷結果不會是百分百,這時透過人工審查的方式就能提高結果的可信度,以確保訓練模型的正確性。例如,掃描一疊抵押申請表時,當掃描品質較差或筆跡不明顯,利用人工審查方式就能提高擷取資訊的可靠度。
- 簡化審查的操作大幅降低人工審查既耗時又昂貴的建置成本。
- 利用 Amazon A2I 加入人工審查流程,大大提升機器學習的效率!
Amazon A2I 運作方式 - 將資料上傳至 AWS AI Service 進行機器學習的訓練。
- Amazon A2I 會把資料分成準確率高與低兩類 ,準確率高的資料會直接放回訓練集,低的則交由人工進行審查。
- 人工審查是將所有審查者加權後的分數將儲存至 Amazon S3,存至完後才將審查的資料放回訓練集。
- 將審查後資料與準確率高的資料一同加入訓練集有助於提升訓練模型的準確率,使結果更符合客戶的需求。
Amazon A2I 的應用
搭配 Amazon Rekognition進行影像或內容審核︰Amazon Rekognition 能夠協助辨識圖片和影片中不安全或不當的內容,並提供詳細的標籤,根據客戶的需求來精準控制可允許露出的內容。我們可以透過 Amazon Rekognition 中預測可信度的規則,將內容審核的工作流程自動化。
對於較為細微、敏感的影片內容,過去往往需要透過訓練有素的專家來進行審 查,以便反覆確認可信度較低的機器預測是否正確。此時,透過 Amazon A2I 即可輕鬆地將人工審查添加到審核工作流程中,例如標記並回傳所有可信度在 50% 至 80% 的明確裸露圖像,來進行額外人工審查,以提升準確度。
搭配 Amazon Textract 進行文檔標記:Amazon Textract 是一種能夠從掃描文檔中自動擷取文字與資料的服務,不僅僅是簡單的光學字元辨識(OCR),更可以辨識表單欄位內容與資料表中的資訊。客戶能夠透過 Amazon Textract 表單資料擷取 API ,並使用 Amazon A2I 定義需要人工審查的條件,且保有隨時調整條件的彈性,以在準確性與成本效益之間取得平衡。
透過該項服務,客戶可以將文件中的重要欄位傳送至人工審查方進行審核。此外,亦可將 Amazon Textract 隨機抽取的範本傳送至審查人員方,並透過抽樣結果進一步了解模型的精確程度。
搭配 Amazon Translate 編輯和標記翻譯:透過人工審核可信度較低的翻譯內容。
搭配 Amazon Transcribe 檢閱影片或社交媒體的轉錄:透過人工審核影片的轉錄,利用審核結果來創建自行定義的詞彙表,並針對未來影片內容的錄製進行改善。
搭配 Amazon Comprehend 進行情緒分析和關鍵片語擷取:透過人工審查文本資料,例如情感分析(sentiment analysis)、語法分析(text syntax)和實體識別(entity detection)。
Amazon A2I 的優勢
簡化人工審查程序的工作流程,讓審查人員輕鬆上手:Amazon A2I 提供了內建的工作流程,逐步引導審查人員完成任務,並提供相關包含完成任務所需的所有說明和指引,讓審查人員得以輕鬆上手。
輕鬆整合 AWS上的其他 ML 服務:Amazon A2I 能輕鬆地將人工審查與 AI 整合至任何 ML 應用程式,客戶可以利用 Amazon A2I API,在任何機器學習應用程式上新增人工審查的功能。
透過多次人工審查的方式改善訓練結果的準確率:Amazon A2I 透過多位人員的審查提高結果的可信度,客戶亦可指定每次審核的人員數量,以確保審核結果的準確度。