AWS Lake Formation

更新於 發佈於 閱讀時間約 4 分鐘

AWS Lake Formation 是一項 Amazon Web Services (AWS) 提供的全受管服務,旨在幫助您在數天內,而不是數個月內,輕鬆地設定、保護和管理資料湖 (data lake)

資料湖是一個集中式、經過整理和安全的儲存庫,可以儲存您所有的資料,無論是原始形式還是準備用於分析的資料。它能幫助您打破資料孤島,結合不同類型的分析來獲得洞察力並指導更好的商業決策。

主要功能和優勢:

  1. 快速建立資料湖:
    • Lake Formation 簡化了建立資料湖的複雜手動任務。您只需指定資料來源以及要套用的資料存取和安全策略。
    • 它會自動爬取(crawl)您的資料來源(例如 Amazon S3、關聯式資料庫、NoSQL 資料庫),將資料移動到您的新 Amazon S3 資料湖中,並進行清理和分類。
    • Lake Formation 還能將資料優化為 Apache Parquet 和 ORC 等格式,以提高分析效率,並內建機器學習功能來去重複和查找匹配記錄,提高資料品質。
  2. 簡化安全管理:
    • 這是 Lake Formation 的核心優勢。您可以集中定義和強制執行資料湖的安全、治理和稽核策略。
    • 它提供自己的權限模型,與 AWS IAM (Identity and Access Management) 權限模型協同工作,實現精細粒度的存取控制。您可以像管理關聯式資料庫一樣,以簡單的「授予」或「撤銷」機制,在資料庫、資料表、欄位、列甚至是單元格級別來限制對資料的存取。
    • 這些策略會跨多個 AWS 分析和機器學習服務一致地執行,包括 Amazon Athena、Amazon QuickSight、Amazon Redshift Spectrum、Amazon EMR 和 AWS Glue 等。
  3. 促進資料發現和共用:
    • Lake Formation 能夠建立一個資料目錄 (Data Catalog),描述可用的不同資料集以及哪些使用者群組可以存取每個資料集。
    • 這使得使用者更容易找到正確的資料集進行分析,並能安全地在組織內部和外部(跨 AWS 帳戶或 AWS Organizations)共用資料,同時保持精細的存取控制。
  4. 自動化 ETL (萃取、轉換、載入) 流程:
    • 除了資料移動和分類,Lake Formation 還可以協助進行資料轉換,例如重寫日期格式以確保一致性。

典型使用場景:

  • 構建安全且合規的資料湖: 需要嚴格控制資料存取並滿足法規要求(如 GDPR、HIPAA)的企業。
  • 整合多源資料進行分析: 將來自不同資料庫、應用程式和雲端儲存的資料匯集到一個地方進行統一分析。
  • 自助式資料分析: 讓資料分析師和資料科學家能夠安全、快速地存取和查詢所需的資料,無需等待 IT 或資料工程師的協助。
  • 支援機器學習專案: 為機器學習模型提供一個統一、安全且易於存取的資料來源。

總之,AWS Lake Formation 解決了資料湖建立、安全和管理的複雜性,讓企業能夠更快速、安全且大規模地從其所有資料中獲取價值。

留言
avatar-img
留言分享你的想法!
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
4會員
223內容數
現職 : 富邦建設資訊副理 經濟部 iPAS AI應用規劃師
2025/06/19
AWS Glue DataBrew 是一項 Amazon Web Services (AWS) 提供的視覺化資料準備工具。它的主要目的是讓資料分析師和資料科學家能夠在不寫任何程式碼的情況下,輕鬆地清理、轉換和正規化資料,以加速資料分析和機器學習 (ML) 專案的資料準備過程。 主要功能和優勢:
2025/06/19
AWS Glue DataBrew 是一項 Amazon Web Services (AWS) 提供的視覺化資料準備工具。它的主要目的是讓資料分析師和資料科學家能夠在不寫任何程式碼的情況下,輕鬆地清理、轉換和正規化資料,以加速資料分析和機器學習 (ML) 專案的資料準備過程。 主要功能和優勢:
2025/06/19
Amazon EMR (Elastic MapReduce) 是一項 Amazon Web Services (AWS) 提供的全受管巨量資料 (Big Data) 處理服務。它使得在雲端上輕鬆、快速且經濟高效地運行和擴展 Apache Hadoop、Apache Spark 以及其他巨量資料框架(
2025/06/19
Amazon EMR (Elastic MapReduce) 是一項 Amazon Web Services (AWS) 提供的全受管巨量資料 (Big Data) 處理服務。它使得在雲端上輕鬆、快速且經濟高效地運行和擴展 Apache Hadoop、Apache Spark 以及其他巨量資料框架(
2025/06/18
Amazon Bedrock 是一個全受管的服務,它提供了一系列基礎模型 (Foundation Models, FMs) 供開發者使用,其中就包含了 Amazon 自家開發的 Amazon Titan 系列模型。 Amazon Titan FM (Foundation Models) 是 AWS
2025/06/18
Amazon Bedrock 是一個全受管的服務,它提供了一系列基礎模型 (Foundation Models, FMs) 供開發者使用,其中就包含了 Amazon 自家開發的 Amazon Titan 系列模型。 Amazon Titan FM (Foundation Models) 是 AWS
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
透過充分利用 AWS Organizations 和 CloudFormation StackSets,您可以更好地實現企業級的雲端管理與控制,為業務的持續發展提供穩固的技術支撐。
Thumbnail
透過充分利用 AWS Organizations 和 CloudFormation StackSets,您可以更好地實現企業級的雲端管理與控制,為業務的持續發展提供穩固的技術支撐。
Thumbnail
疫情世代後,企業在思考的已經不是要不要上雲,而是哪些服務或內容可以上雲,透過混合雲的形式,搭配公司的策略達到靈活且彈性的最佳效益。 而既然要能達到最佳效益,選擇適合公司環境的雲端環境,對於現代企業來說非常重要,這篇文章將與大家分享AWS、GCP、Azure三大公有雲的特點與優勢。
Thumbnail
疫情世代後,企業在思考的已經不是要不要上雲,而是哪些服務或內容可以上雲,透過混合雲的形式,搭配公司的策略達到靈活且彈性的最佳效益。 而既然要能達到最佳效益,選擇適合公司環境的雲端環境,對於現代企業來說非常重要,這篇文章將與大家分享AWS、GCP、Azure三大公有雲的特點與優勢。
Thumbnail
對 AWS Certified Cloud Practitioner 證照考試難度的看法、學習方法和考試內容的介紹。
Thumbnail
對 AWS Certified Cloud Practitioner 證照考試難度的看法、學習方法和考試內容的介紹。
Thumbnail
本篇使用 AWS Lambda 結合 Amazon Bedrock 和 Claude 3 來分析儲存在 Amazon S3 中的圖像的示範
Thumbnail
本篇使用 AWS Lambda 結合 Amazon Bedrock 和 Claude 3 來分析儲存在 Amazon S3 中的圖像的示範
Thumbnail
實踐AWS中使用Lambda來負責登入簽核及與OpenAI API溝通,並利用S3容器託管一個靜態網頁做為前端
Thumbnail
實踐AWS中使用Lambda來負責登入簽核及與OpenAI API溝通,並利用S3容器託管一個靜態網頁做為前端
Thumbnail
實驗目的:Lambda@Edge (L@E) 讓 CLoudFront (CF) 回源時,自動選擇較近的 S3 region 回源
Thumbnail
實驗目的:Lambda@Edge (L@E) 讓 CLoudFront (CF) 回源時,自動選擇較近的 S3 region 回源
Thumbnail
客戶提出以下需求: 當用戶在日本,會導到離用戶最近的CloudFront節點(亞洲),當CF要回原站時,需要導到新加坡的S3 當用戶為美國,會導到離用戶最近的CloudFront節點(美國東岸),當CF要回原站時,需要導到美國的S3
Thumbnail
客戶提出以下需求: 當用戶在日本,會導到離用戶最近的CloudFront節點(亞洲),當CF要回原站時,需要導到新加坡的S3 當用戶為美國,會導到離用戶最近的CloudFront節點(美國東岸),當CF要回原站時,需要導到美國的S3
Thumbnail
AWS CloudFront + S3 遇到 CORS 解決方式
Thumbnail
AWS CloudFront + S3 遇到 CORS 解決方式
Thumbnail
Simple Storage Service (S3) 是 AWS 最常應用到的服務,只要是需要將檔案上傳到雲端的狀況都可以使用S3,本篇文章將介紹如何設定與使用AWS S3。
Thumbnail
Simple Storage Service (S3) 是 AWS 最常應用到的服務,只要是需要將檔案上傳到雲端的狀況都可以使用S3,本篇文章將介紹如何設定與使用AWS S3。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News