AWS Lake Formation

更新 發佈閱讀 4 分鐘

AWS Lake Formation 是一項 Amazon Web Services (AWS) 提供的全受管服務,旨在幫助您在數天內,而不是數個月內,輕鬆地設定、保護和管理資料湖 (data lake)

資料湖是一個集中式、經過整理和安全的儲存庫,可以儲存您所有的資料,無論是原始形式還是準備用於分析的資料。它能幫助您打破資料孤島,結合不同類型的分析來獲得洞察力並指導更好的商業決策。

主要功能和優勢:

  1. 快速建立資料湖:
    • Lake Formation 簡化了建立資料湖的複雜手動任務。您只需指定資料來源以及要套用的資料存取和安全策略。
    • 它會自動爬取(crawl)您的資料來源(例如 Amazon S3、關聯式資料庫、NoSQL 資料庫),將資料移動到您的新 Amazon S3 資料湖中,並進行清理和分類。
    • Lake Formation 還能將資料優化為 Apache Parquet 和 ORC 等格式,以提高分析效率,並內建機器學習功能來去重複和查找匹配記錄,提高資料品質。
  2. 簡化安全管理:
    • 這是 Lake Formation 的核心優勢。您可以集中定義和強制執行資料湖的安全、治理和稽核策略。
    • 它提供自己的權限模型,與 AWS IAM (Identity and Access Management) 權限模型協同工作,實現精細粒度的存取控制。您可以像管理關聯式資料庫一樣,以簡單的「授予」或「撤銷」機制,在資料庫、資料表、欄位、列甚至是單元格級別來限制對資料的存取。
    • 這些策略會跨多個 AWS 分析和機器學習服務一致地執行,包括 Amazon Athena、Amazon QuickSight、Amazon Redshift Spectrum、Amazon EMR 和 AWS Glue 等。
  3. 促進資料發現和共用:
    • Lake Formation 能夠建立一個資料目錄 (Data Catalog),描述可用的不同資料集以及哪些使用者群組可以存取每個資料集。
    • 這使得使用者更容易找到正確的資料集進行分析,並能安全地在組織內部和外部(跨 AWS 帳戶或 AWS Organizations)共用資料,同時保持精細的存取控制。
  4. 自動化 ETL (萃取、轉換、載入) 流程:
    • 除了資料移動和分類,Lake Formation 還可以協助進行資料轉換,例如重寫日期格式以確保一致性。

典型使用場景:

  • 構建安全且合規的資料湖: 需要嚴格控制資料存取並滿足法規要求(如 GDPR、HIPAA)的企業。
  • 整合多源資料進行分析: 將來自不同資料庫、應用程式和雲端儲存的資料匯集到一個地方進行統一分析。
  • 自助式資料分析: 讓資料分析師和資料科學家能夠安全、快速地存取和查詢所需的資料,無需等待 IT 或資料工程師的協助。
  • 支援機器學習專案: 為機器學習模型提供一個統一、安全且易於存取的資料來源。

總之,AWS Lake Formation 解決了資料湖建立、安全和管理的複雜性,讓企業能夠更快速、安全且大規模地從其所有資料中獲取價值。

留言
avatar-img
留言分享你的想法!
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
29會員
495內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)
2025/06/19
AWS Glue DataBrew 是一項 Amazon Web Services (AWS) 提供的視覺化資料準備工具。它的主要目的是讓資料分析師和資料科學家能夠在不寫任何程式碼的情況下,輕鬆地清理、轉換和正規化資料,以加速資料分析和機器學習 (ML) 專案的資料準備過程。 主要功能和優勢:
2025/06/19
AWS Glue DataBrew 是一項 Amazon Web Services (AWS) 提供的視覺化資料準備工具。它的主要目的是讓資料分析師和資料科學家能夠在不寫任何程式碼的情況下,輕鬆地清理、轉換和正規化資料,以加速資料分析和機器學習 (ML) 專案的資料準備過程。 主要功能和優勢:
2025/06/19
Amazon EMR (Elastic MapReduce) 是一項 Amazon Web Services (AWS) 提供的全受管巨量資料 (Big Data) 處理服務。它使得在雲端上輕鬆、快速且經濟高效地運行和擴展 Apache Hadoop、Apache Spark 以及其他巨量資料框架(
2025/06/19
Amazon EMR (Elastic MapReduce) 是一項 Amazon Web Services (AWS) 提供的全受管巨量資料 (Big Data) 處理服務。它使得在雲端上輕鬆、快速且經濟高效地運行和擴展 Apache Hadoop、Apache Spark 以及其他巨量資料框架(
2025/06/18
Amazon Bedrock 是一個全受管的服務,它提供了一系列基礎模型 (Foundation Models, FMs) 供開發者使用,其中就包含了 Amazon 自家開發的 Amazon Titan 系列模型。 Amazon Titan FM (Foundation Models) 是 AWS
2025/06/18
Amazon Bedrock 是一個全受管的服務,它提供了一系列基礎模型 (Foundation Models, FMs) 供開發者使用,其中就包含了 Amazon 自家開發的 Amazon Titan 系列模型。 Amazon Titan FM (Foundation Models) 是 AWS
看更多
你可能也想看
Thumbnail
去歐洲真的是又興奮又緊張。網路上常說歐洲治安不好,行前說明會時領隊也提醒:「不要背後背包,隨身物要放在前面比較安全!」 但出國玩總是想打扮得美美的啊~而且隨身總得帶些實用小物:雨傘、濕紙巾、小瓶水、萬用藥膏……體積雖小,但零零總總裝起來也不少。我在蝦皮購買了這4樣超實用旅遊好物!減緩我的焦慮感。
Thumbnail
去歐洲真的是又興奮又緊張。網路上常說歐洲治安不好,行前說明會時領隊也提醒:「不要背後背包,隨身物要放在前面比較安全!」 但出國玩總是想打扮得美美的啊~而且隨身總得帶些實用小物:雨傘、濕紙巾、小瓶水、萬用藥膏……體積雖小,但零零總總裝起來也不少。我在蝦皮購買了這4樣超實用旅遊好物!減緩我的焦慮感。
Thumbnail
開箱 3 套深受 0-6 歲寶寶喜愛的互動式童書,包含 Bizzy Bear 推拉書、小小音樂大師有聲書、Poke A Dot 泡泡書,有效提升寶寶閱讀興趣與親子共讀時光。搭配蝦皮雙 11 購物攻略,教你如何鎖定免運、折價券、高額回饋,並透過蝦皮分潤計畫,將日常購物開銷轉化為穩定育兒基金,聰明消費。
Thumbnail
開箱 3 套深受 0-6 歲寶寶喜愛的互動式童書,包含 Bizzy Bear 推拉書、小小音樂大師有聲書、Poke A Dot 泡泡書,有效提升寶寶閱讀興趣與親子共讀時光。搭配蝦皮雙 11 購物攻略,教你如何鎖定免運、折價券、高額回饋,並透過蝦皮分潤計畫,將日常購物開銷轉化為穩定育兒基金,聰明消費。
Thumbnail
透過充分利用 AWS Organizations 和 CloudFormation StackSets,您可以更好地實現企業級的雲端管理與控制,為業務的持續發展提供穩固的技術支撐。
Thumbnail
透過充分利用 AWS Organizations 和 CloudFormation StackSets,您可以更好地實現企業級的雲端管理與控制,為業務的持續發展提供穩固的技術支撐。
Thumbnail
疫情世代後,企業在思考的已經不是要不要上雲,而是哪些服務或內容可以上雲,透過混合雲的形式,搭配公司的策略達到靈活且彈性的最佳效益。 而既然要能達到最佳效益,選擇適合公司環境的雲端環境,對於現代企業來說非常重要,這篇文章將與大家分享AWS、GCP、Azure三大公有雲的特點與優勢。
Thumbnail
疫情世代後,企業在思考的已經不是要不要上雲,而是哪些服務或內容可以上雲,透過混合雲的形式,搭配公司的策略達到靈活且彈性的最佳效益。 而既然要能達到最佳效益,選擇適合公司環境的雲端環境,對於現代企業來說非常重要,這篇文章將與大家分享AWS、GCP、Azure三大公有雲的特點與優勢。
Thumbnail
對 AWS Certified Cloud Practitioner 證照考試難度的看法、學習方法和考試內容的介紹。
Thumbnail
對 AWS Certified Cloud Practitioner 證照考試難度的看法、學習方法和考試內容的介紹。
Thumbnail
本篇使用 AWS Lambda 結合 Amazon Bedrock 和 Claude 3 來分析儲存在 Amazon S3 中的圖像的示範
Thumbnail
本篇使用 AWS Lambda 結合 Amazon Bedrock 和 Claude 3 來分析儲存在 Amazon S3 中的圖像的示範
Thumbnail
實踐AWS中使用Lambda來負責登入簽核及與OpenAI API溝通,並利用S3容器託管一個靜態網頁做為前端
Thumbnail
實踐AWS中使用Lambda來負責登入簽核及與OpenAI API溝通,並利用S3容器託管一個靜態網頁做為前端
Thumbnail
實驗目的:Lambda@Edge (L@E) 讓 CLoudFront (CF) 回源時,自動選擇較近的 S3 region 回源
Thumbnail
實驗目的:Lambda@Edge (L@E) 讓 CLoudFront (CF) 回源時,自動選擇較近的 S3 region 回源
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News