Amazon Kendra 是一項 由機器學習驅動的智慧型企業搜尋服務 (Intelligent Enterprise Search Service)。它的設計目的是幫助企業和組織,能夠從分散在不同資料來源的大量資訊中,快速且精準地找到他們需要的答案。
Amazon Kendra 的核心功能和優勢
不同於傳統的關鍵字搜尋,Amazon Kendra 運用自然語言處理 (NLP) 和深度學習模型來理解使用者查詢的語義和上下文,並提供更相關、更精準的答案,甚至是文件中的特定段落。
以下是它的主要功能和優勢:- 智慧型搜尋與自然語言理解 (NLU):
- 自然語言查詢: 使用者可以用日常語言提問(例如:「我如何申請育嬰假?」),而不需要使用特定的關鍵字。
- 語義理解: Kendra 不僅僅匹配關鍵字,更能理解查詢的意圖和語義,即使文件中的措辭不同,也能找到相關資訊。
- 即時答案與 FAQ 支援: 能夠從文件、FAQ 中直接提供精準的答案或推薦相關段落,而非僅僅提供文件連結。
- 文件排名與相關性: 根據與查詢的相關性,對搜尋結果進行智能排序。
- 多資料來源整合:
- Kendra 能夠連接並索引來自多個不同來源的數據,包括:
- 雲端儲存:Amazon S3、SharePoint Online、Box、Dropbox、Google Drive 等。
- 企業應用程式:Salesforce、ServiceNow、Jira、Confluence 等。
- 資料庫:Amazon RDS、Amazon Aurora 等。
- 網頁和內部文件:可以爬取網站內容,並處理 PDF、Word、PowerPoint、HTML、TXT 等多種文件格式。
- 這使得企業能夠建立一個統一的知識搜尋入口,無需在各個系統之間切換。
- 開箱即用的機器學習能力:
- Kendra 是一個全託管服務,這意味著你不需要具備機器學習專業知識,也不需要管理底層的伺服器基礎設施。
- 它的模型已針對 14 個不同的行業領域(如 HR、金融、法律、醫療保健)進行了預訓練,能夠更好地理解行業術語和內容。
- 它還具備漸進式學習能力,可以根據使用者的回饋(例如:點擊、讚/倒讚)和搜尋趨勢來持續改進搜尋結果的準確性。
- 客製化與調校:
- 你可以根據特定的業務目標或使用者需求,透過自訂標籤、資料來源權重、文件新鮮度等方式來調整搜尋結果的相關性。
- 支援存取控制列表 (ACL),確保使用者只能看到他們有權限訪問的內容。
- 與生成式 AI 整合 (GenAI Index):
- Kendra 提供了 GenAI Enterprise Edition 索引,專門為 檢索增強生成 (Retrieval Augmented Generation, RAG) 工作流程進行了優化。
- 你可以將 Kendra 的 GenAI 索引與 Amazon Bedrock 的知識庫或 Amazon Q Business 結合使用,為大型語言模型 (LLM) 提供精準的企業內部數據,從而構建更精確、更安全的生成式 AI 應用程式(例如:企業內部聊天機器人)。
- Kendra 的 Retriever API 可以智能地將文件分塊 (chunking),並只將最相關的段落傳送給 LLM,提高生成答案的品質並降低成本。
- 企業級安全與合規:
- 提供強大的安全功能,包括資料傳輸中和靜態時的加密、存取控制以及符合行業標準的合規性。
Amazon Kendra 的運作方式
- 建立索引 (Index):這是 Kendra 儲存和管理你的文件的地方。
- 連接資料來源 (Data Sources):將你的各種內容儲存庫連接到 Kendra 索引。Kendra 會自動爬取並同步這些資料。
- 文件攝取與處理 (Document Ingestion & Processing):Kendra 會自動從連接的資料來源中攝取文件,並利用機器學習進行處理,包括:
- 提取文本
- 識別實體和關鍵短語
- 理解語義和上下文
- 建立索引,使其可被搜尋。
- 使用者查詢 (User Query):當使用者輸入自然語言查詢時,Kendra 會分析查詢的意圖。
- 智慧型搜尋與答案生成: Kendra 會在索引中搜尋最相關的文件和段落,並提供精準的答案、FAQ 或排名靠前的文件清單。
Amazon Kendra 的應用場景
- 企業知識管理: 讓員工快速找到公司政策、技術文件、內部報告、HR 資訊等,提高員工生產力。
- 客戶服務: 建立智能客服聊天機器人或代理人輔助系統,讓客服人員或客戶能夠即時找到產品資訊、故障排除指南、常見問題解答。
- 研究與開發: 幫助研究人員快速搜尋大量學術論文、專利和研究數據。
- 法律與合規: 從法律文件、合同中快速提取相關條款和資訊。
- 內容創作者: 快速搜尋現有內容,用於文章撰寫、行銷文案或新產品開發。
Amazon Kendra 的計費方式
Amazon Kendra 的計費主要基於你選擇的版本 (Edition)、索引的儲存容量 (Storage Units) 和查詢處理量 (Query Units)。
- 版本:
- GenAI Enterprise Edition: 提供最高的檢索準確性,並專為 RAG 和生成式 AI 應用優化。
- Basic Enterprise Edition: 提供語義搜尋功能,適合生產環境。
- Basic Developer Edition: 適用於開發和測試,功能較少且不適用於生產環境。
- 索引儲存: 根據你索引的文件數量或提取的文本大小來計費。
- 查詢單位: 根據每秒查詢次數 (QPS) 或處理的查詢量來計費。
- 連接器 (Connectors): 某些資料來源連接器在同步資料時可能會產生額外費用。
AWS 提供免費試用層,讓你可以體驗部分 Kendra 功能。因為價格會隨地區和具體使用情況而異,建議你查閱 AWS 官方網站的 Amazon Kendra 定價頁面以獲取最準確的資訊。
總之,Amazon Kendra 是一項強大的服務,旨在解決企業內部資訊過於分散、難以搜尋的問題,透過智能化的搜尋功能,大幅提升員工和客戶尋找資訊的效率。