Amazon Rekognition

更新 發佈閱讀 7 分鐘

Amazon Rekognition 是一款 由機器學習驅動的雲端電腦視覺服務,它讓開發人員能夠輕鬆地為其應用程式添加影像和影片分析功能,而無需具備機器學習專業知識。它利用深度學習技術,能夠自動識別影像和影片中的物件、人物、活動、場景以及不安全的內容。


Amazon Rekognition 的核心功能

Amazon Rekognition 提供了多種強大的功能,可以對圖像和影片進行深度分析:

  • 物件、場景與概念偵測 (Object, Scene, and Concept Detection)
    • 能夠識別圖像或影片中數千種物件(例如:汽車、樹、椅子)、場景(例如:海灘、城市、室內)和抽象概念(例如:快樂、戶外活動)。
    • 這對於建立可搜尋的媒體庫、自動標記內容非常有用。
  • 文字偵測 (Text Detection)
    • 從圖像和影片中偵測並識別印刷和手寫文字,即使文字傾斜、模糊或位於複雜背景中。
    • 應用於從街頭標誌、產品包裝、社群媒體貼文或掃描文件等提取資訊。
  • 臉部偵測與分析 (Face Detection and Analysis)
    • 偵測圖像和影片中是否存在臉部。
    • 分析臉部屬性,例如性別、年齡範圍、情緒(開心、平靜、厭惡等)、是否戴眼鏡、是否有鬍鬚、是否微笑等。
  • 臉部比對與搜尋 (Face Comparison and Search)
    • 臉部比對 (Face Comparison):判斷兩張圖片中的臉部是否屬於同一個人,並提供相似度分數。常用於使用者身份驗證。
    • 臉部搜尋 (Face Search):在預先建立的臉部集合 (Face Collection) 中搜尋與輸入臉部最相似的臉部,可以用於識別已知人員或尋找相似面孔。
  • 名人識別 (Celebrity Recognition)
    • 能夠識別圖像和影片中數以千計的知名人士(名人)。這對於媒體、行銷和廣告行業非常有用。
  • 內容審核 (Content Moderation)
    • 自動偵測圖像和影片中潛在的不安全、不適當、色情或暴力內容。這對於建立一個安全的線上環境(例如社群媒體平台、電商網站)至關重要。
    • 提供不同層級的審核標籤和置信度分數,方便你根據自己的業務標準進行過濾。
  • 路徑追蹤 (People Pathing)
    • 在影片中追蹤人物的移動路徑,這對於體育分析、零售店內的顧客流量分析等場景很有用。
  • 個人防護設備 (PPE) 偵測 (PPE Detection)
    • 偵測圖像或影片中的人員是否穿戴了個人防護設備,如安全帽、手套、面罩等,有助於工地或工廠的安全監控。
  • 客製化標籤 (Custom Labels)
    • 如果你需要識別模型預設沒有的特定物件、品牌標誌、產品或場景,你可以透過提供少量自有圖片來訓練自訂模型。這讓 Rekognition 能夠滿足你獨特的業務需求。
  • 人臉活體偵測 (Face Liveness)
    • 辨識使用者是否為真人,以防止欺騙攻擊,例如使用照片、影片或 3D 面具進行身份驗證。

Amazon Rekognition 的應用場景

  • 建立可搜尋的媒體庫:自動為圖片和影片添加標籤和描述,方便快速搜尋特定內容(例如:搜尋所有包含「汽車」和「戶外」的圖片)。
  • 內容審核與安全:自動過濾掉網站或應用程式中的不當內容,保護使用者免受有害資訊的影響。
  • 身份驗證與安全:透過臉部比對來驗證使用者身份,例如在線上銀行、電商平台或門禁系統中。
  • 客戶互動與體驗:分析客戶情緒、人群計數,或提供個人化的內容推薦。
  • 零售與電子商務:識別產品、品牌標誌,分析店內人流,提升商品發現率。
  • 公共安全與監控:識別已知人物、追蹤可疑活動或確保工作場所安全(例如 PPE 偵測)。
  • 體育分析與媒體製作:分析運動員在比賽中的動作、追蹤他們的運動軌跡,或自動標記影片中的關鍵時刻。

Amazon Rekognition 的優勢

  • 無需機器學習專業知識:作為全託管服務,你無需管理底層的機器學習模型或基礎設施。
  • 高準確性:基於 Amazon 內部使用的深度學習技術,提供高精度的分析結果。
  • 大規模擴展:可以輕鬆處理數百萬張圖像和數千小時的影片內容。
  • 成本效益:按實際使用量付費,無需前期投入。
  • 易於整合:提供簡單的 API,可輕鬆整合到你的應用程式中。

Amazon Rekognition 的計費方式

Amazon Rekognition 的計費方式是按使用量付費 (pay-as-you-go),主要根據你使用的功能和處理的影像/影片數量或時長。

主要計費項目包括:

  • 影像分析 (Image Analysis)
    • 按處理的圖像數量計費,費用會根據不同功能(例如標籤偵測、臉部分析、名人識別、內容審核、文字偵測等)有所不同。
  • 影片分析 (Video Analysis)
    • 按處理的影片時長(分鐘)計費,費用也根據不同功能(例如標籤偵測、人員追蹤、內容審核、文字偵測等)有所不同。儲存影片和串流影片的計費標準可能不同。
  • 人臉活體偵測 (Face Liveness)
    • 按每次測試的費用計費。
  • 自訂標籤 (Custom Labels)
    • 訓練費用:按訓練模型所用的時間(小時)計費。
    • 推論費用:按使用自訂模型進行分析時的推論時間(小時)或處理的圖像數量計費。
  • 自訂審核 (Custom Moderation)
    • 按訓練模型和推論時的圖像數量計費。

AWS 提供免費試用層 (Free Tier),讓你可以免費體驗 Amazon Rekognition 的部分功能(例如每月一定數量的影像和影片分析)。

由於具體價格會因地區、你使用的功能類型、處理的數據量以及是否為標準/神經語音等因素而有很大差異,建議你查閱 AWS 官方網站的 Amazon Rekognition 定價頁面 (aws.amazon.com/rekognition/pricing/),並使用 AWS 定價計算器 來估算你的具體成本。


總而言之,Amazon Rekognition 為各種規模的企業提供了強大的電腦視覺能力,讓他們能夠從視覺內容中提取寶貴的洞察,進而提升用戶體驗、自動化流程並提高安全性。

留言
avatar-img
留言分享你的想法!
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
21會員
495內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)
2025/06/10
Amazon Foundation Models (基礎模型)是一種大型的機器學習模型,經過了海量資料的訓練,可以用於執行各種不同的任務,例如文字生成、翻譯、問答、程式碼生成等等。它們之所以被稱為「基礎」模型,是因為它們可以作為許多下游任務的基礎,只需要針對特定任務進行少量的調整(稱為微調)即可。
2025/06/10
Amazon Foundation Models (基礎模型)是一種大型的機器學習模型,經過了海量資料的訓練,可以用於執行各種不同的任務,例如文字生成、翻譯、問答、程式碼生成等等。它們之所以被稱為「基礎」模型,是因為它們可以作為許多下游任務的基礎,只需要針對特定任務進行少量的調整(稱為微調)即可。
2025/06/10
Amazon Q Business 是 AWS (Amazon Web Services) 提供的一款由生成式 AI 驅動的工作助理。它的目標是提高員工的生產力和效率。它可以連接到您公司的各種資料、資訊和系統,快速成為您業務的專家,並協助員工完成各種任務。 簡單來說,Amazon Q Busine
2025/06/10
Amazon Q Business 是 AWS (Amazon Web Services) 提供的一款由生成式 AI 驅動的工作助理。它的目標是提高員工的生產力和效率。它可以連接到您公司的各種資料、資訊和系統,快速成為您業務的專家,並協助員工完成各種任務。 簡單來說,Amazon Q Busine
2025/06/10
Amazon Kendra 是一種由 AWS (Amazon Web Services) 提供的智慧型搜尋服務,專為企業打造。它利用機器學習 (ML) 和自然語言處理 (NLP) 技術,讓使用者能夠在企業內大量分散的內容中,透過自然語言提問,快速找到所需的資訊。 簡單來說,Amazon Kendr
2025/06/10
Amazon Kendra 是一種由 AWS (Amazon Web Services) 提供的智慧型搜尋服務,專為企業打造。它利用機器學習 (ML) 和自然語言處理 (NLP) 技術,讓使用者能夠在企業內大量分散的內容中,透過自然語言提問,快速找到所需的資訊。 簡單來說,Amazon Kendr
看更多
你可能也想看
Thumbnail
本文探討了影像生成模型的多種應用,包括文字、圖像和聲音到影片的生成,涵蓋了GAN、Transformer和Diffusion等技術。透過回顧相關研究,分析影像生成技術的未來趨勢與挑戰,為讀者提供全面的理解與啟示。
Thumbnail
本文探討了影像生成模型的多種應用,包括文字、圖像和聲音到影片的生成,涵蓋了GAN、Transformer和Diffusion等技術。透過回顧相關研究,分析影像生成技術的未來趨勢與挑戰,為讀者提供全面的理解與啟示。
Thumbnail
前言 讀了許多理論,是時候實際動手做做看了,以下是我的模型訓練初體驗,有點糟就是了XD。 正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,
Thumbnail
前言 讀了許多理論,是時候實際動手做做看了,以下是我的模型訓練初體驗,有點糟就是了XD。 正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,
Thumbnail
此篇調查論文探討了Diffusion模型在文字、圖片和聲音轉換為影片,以及影片衍生和編輯的應用類型。作者也介紹了U-Net架構和Vision Transformer等生成圖像架構,並詳細探討了訓練模型的方法以及不同的影像資料集來源。
Thumbnail
此篇調查論文探討了Diffusion模型在文字、圖片和聲音轉換為影片,以及影片衍生和編輯的應用類型。作者也介紹了U-Net架構和Vision Transformer等生成圖像架構,並詳細探討了訓練模型的方法以及不同的影像資料集來源。
Thumbnail
AnyText是一款先進的圖像AI工具,利用深度學習技術,根據你輸入的文字描述生成圖像,更棒的是,它能生成繁體中文,而且能指定文字生成的位置。
Thumbnail
AnyText是一款先進的圖像AI工具,利用深度學習技術,根據你輸入的文字描述生成圖像,更棒的是,它能生成繁體中文,而且能指定文字生成的位置。
Thumbnail
會不會有時候只是想要簡單的快速影片去背,剛好電腦沒有安裝適合的影片剪接軟體呢?pinokio這網站提共大量的AI小工具,只要安裝他在桌面,立即可獲最新的AI工具,並且他隨時更新最新版本,省下大量爬文搜尋時間,正適合不會程式的使用者一鍵無腦享受AI帶來的便利與快速。 這次介紹裡面一個好用的小工具"R
Thumbnail
會不會有時候只是想要簡單的快速影片去背,剛好電腦沒有安裝適合的影片剪接軟體呢?pinokio這網站提共大量的AI小工具,只要安裝他在桌面,立即可獲最新的AI工具,並且他隨時更新最新版本,省下大量爬文搜尋時間,正適合不會程式的使用者一鍵無腦享受AI帶來的便利與快速。 這次介紹裡面一個好用的小工具"R
Thumbnail
高細節-- high details 高解析度-- high resolution 高清--1080P/4K/8K 細節-- detailed 無縫-- seamless 高清畫質--full HD 電影感-- Cinematic 攝影-- photography 生動色彩-
Thumbnail
高細節-- high details 高解析度-- high resolution 高清--1080P/4K/8K 細節-- detailed 無縫-- seamless 高清畫質--full HD 電影感-- Cinematic 攝影-- photography 生動色彩-
Thumbnail
很多AI只要輸入相關的鏡頭的關鍵字,視覺畫面會隨著鏡頭移動。 鏡頭與視角的關鍵字: 微觀|Microscopic view 焦點,對焦|Focus 第一人稱|First person perspective 第三人稱|Third person perspective 特寫|Close
Thumbnail
很多AI只要輸入相關的鏡頭的關鍵字,視覺畫面會隨著鏡頭移動。 鏡頭與視角的關鍵字: 微觀|Microscopic view 焦點,對焦|Focus 第一人稱|First person perspective 第三人稱|Third person perspective 特寫|Close
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News