最近 AWS 剛剛推出 Amazon S3 Vectors (Preview),這是一套專門為向量資料設計的持久儲存解決方案,最多可幫助企業 降低多達 90% 的向量上傳、儲存與查詢成本。這項新服務是公有雲第一個原生支援大型向量資料集儲存的物件儲存系統,同時具備亞秒級查詢效能,讓企業能夠以更低的成本儲存大規模、適用於 AI 的資料集。
向量搜尋(Vector Search)向量資料庫:驅動 AI 應用發展的幕後功臣 是一種日益重要的技術,廣泛應用於生成式 AI,例如文字、影像或語音搜尋。它的核心是比較資料的「向量表示」,透過距離或相似度演算法,找出與輸入最相近的資料點。這些「向量」是透過 embedding 模型 將非結構化資料(如文字、圖片)轉換成的數值表示。您可以使用這些模型將資料轉換成向量,再儲存到 Amazon S3 Vectors,以進行語意搜尋與相似資料比對。

Amazon S3 Vectors 引入了一種全新的儲存桶類型:向量桶(vector buckets),具備專用的 API,用於儲存、存取與查詢向量資料,且無需預先部署任何基礎設施。
建立 S3 向量桶後,您可以在其中建立多個向量索引(vector indexes)來組織資料,讓執行相似度查詢變得更加簡單。每個向量桶最多可擁有 10,000 個向量索引,而每個索引則可儲存數千萬筆向量資料。在您建立好向量索引後,新增向量資料時可以同時附加 key-value 格式的中繼資料。這些中繼資料可用來在未來查詢時進行條件篩選,例如依據日期、分類或使用者偏好等欄位進行過濾。
隨著您不斷寫入、更新與刪除向量資料,S3 Vectors 會自動對資料進行最佳化,確保即使資料集規模擴大、結構變動,仍能維持最佳的儲存效能與成本效益。透過向量桶與索引架構,S3 Vectors 讓大規模 AI 向量資料的管理變得前所未有地簡單與高效。

S3 Vectors 原生整合了 Amazon Bedrock Knowledge Bases,並可在 Amazon SageMaker Unified Studio 中使用,讓開發者能更輕鬆打造具成本效益的 RAG 應用程式。另外與 Amazon OpenSearch Service 的整合,您可以將查詢頻率較低的向量資料儲存在 S3 Vectors 中,降低整體儲存成本;而當查詢需求上升或需要即時低延遲的搜尋操作時,則可快速將這些向量移轉至 OpenSearch 使用。
使用 S3 Vectors,您現在可以更經濟地儲存代表大量非結構化資料(如圖片、影片、文件與音訊)的向量嵌入資料,進而支援大規模的生成式 AI 應用,包括語意搜尋、相似度比對、RAG 與代理記憶(agent memory)建構等。您也可以藉由 S3 Vectors 打造各式應用程式,支援廣泛的產業使用情境,包括:
- 個人化推薦系統
- 自動化內容分析
- 智慧文件處理
而這一切皆可實現,無需承擔傳統向量資料庫的高建置與維運成本。