Amazon SageMaker Feature Store 是一個全託管的機器學習特徵(features)儲存和管理服務,專門用於建立、儲存、共用和管理機器學習模型所需的特徵資料。
主要功能和特點包括:
• 集中管理特徵資料:作為機器學習特徵的單一事實來源,方便特徵的儲存、擷取、移除、追蹤、共用和探索。• 特徵群組(Feature Groups):將相關特徵集合成群組,方便管理和使用,並能隨時調整結構。
• 線上儲存(Online Store):提供低延遲、高可用性的特徵存取,適合即時推論需求,支援毫秒級讀取和高吞吐量寫入。
• 離線儲存(Offline Store):將歷史特徵資料存放於 Amazon S3,適合資料探索、模型訓練和批次推論,讀取延遲較高但可保留完整歷史。
• 支援串流與批次資料匯入:可透過 API 實時更新特徵資料,或批次匯入大規模資料,靈活應用於不同場景。
• 減少訓練與推論間的偏差:透過一致的特徵處理和儲存,降低訓練與服務環境中資料差異帶來的模型準確度影響。
簡言之,SageMaker Feature Store 讓機器學習團隊能夠高效且一致地管理模型所需的特徵資料,支援從資料預處理、模型訓練到即時推論的完整流程。