Amazon CloudWatch 新增 Metrics 可以監控 EBS 運作狀況(實用)

更新於 發佈於 閱讀時間約 2 分鐘


新加入的指標

VolumeStalledIOCheck

此指標是二進位值,將根據 EBS 磁碟區是否可以完成 I/O 操作傳回 0(通過)或 1(失敗)狀態。

可能原因:

  • EBS 磁碟區底層儲存子系統的硬體或軟體問題
  • 實體主機上的硬體問題會影響 EC2 執行個體中的 EBS 磁碟區的可及性
  • 實例和 EBS 磁碟區之間的連線問題

如果VolumeStalledIOCheck指標失敗,您可以等待 AWS 解決問題,也可以採取措施,例如取代受影響的磁碟區或停止並重新啟動該磁碟區所附加的執行個體。在大多數情況下,當該指標失敗時,EBS 將在幾分鐘內自動診斷並恢復您的磁碟區[1]。


StatusCheckFailed_AttachedEBS

該指標監控您的 EBS 磁碟區是否正確連接到 EC2 執行個體並且可以正確執行 I/O 操作

以下是可能導致附加 EBS 狀態檢查失敗的問題範例:

  • EBS 磁碟區底層儲存子系統的硬體或軟體問題
  • 實體主機上影響 EBS 磁碟區的可及性的硬體問題
  • 實例和 EBS 磁碟區之間的連線問題

您可以使用該StatusCheckFailed_AttachedEBS指標來幫助提高工作負載的彈性。


兩者差異

VolumeStalledIOCheck它是AWS/EBS指標

StatusCheckFailed_AttachedEBS它是AWS/EC2指標


如圖可以看到兩個指標都是健康狀態

raw-image


我們可以使用 AWS Fault Injection Service [3] 服務,可以模擬 EBS 磁碟區上的 I/O 停止,來檢查指標是否會改變

raw-image

選擇測試時間,測試費用可以幫您估算

raw-image

可以看到對於EBS 一分鐘的I/O 停止,對於StatusCheckFailed_AttachedEBS 較無反應

raw-image

那停止 6 分鐘,就可以看到兩種指標都會知道目前 EBS 都出狀況,建議兩種都要同時監控

raw-image


目前只有使用 Nitro 系統建置的實例才符合資格。


[1] https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-io-characteristics.html#ebs-io-metrics

[2] https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/monitoring-system-instance-status-check.html#attached-ebs-status-checks

[3] https://aws.amazon.com/tw/fis/

留言
avatar-img
留言分享你的想法!
avatar-img
西尼亞ming的沙龍
16會員
80內容數
西尼亞ming的沙龍的其他內容
2024/11/05
在ops-agent當中可以安裝 JVM 來收集 Java 參數,該工具主要收集 memory 以及 garbage collection 的參數,其中監控的選項有包含以下: jvm.classes.loaded jvm.gc.collections.count jvm.gc.collec
2024/11/05
在ops-agent當中可以安裝 JVM 來收集 Java 參數,該工具主要收集 memory 以及 garbage collection 的參數,其中監控的選項有包含以下: jvm.classes.loaded jvm.gc.collections.count jvm.gc.collec
2024/11/05
**Google Cloud 操作與 Audit Logs 說明** Google Cloud 作為純雲端服務提供商,所有操作均透過 HTTPS 網頁或 API 呼叫完成,並無「登入專案」的行為紀錄。不過,若使用 Google Workspace 管理使用者身份,則可以透過 Google
2024/11/05
**Google Cloud 操作與 Audit Logs 說明** Google Cloud 作為純雲端服務提供商,所有操作均透過 HTTPS 網頁或 API 呼叫完成,並無「登入專案」的行為紀錄。不過,若使用 Google Workspace 管理使用者身份,則可以透過 Google
2024/11/05
使用 Storage Transfer 服務是否能降低成本? Storage Transfer 的計價方式針對從 Cloud Storage 轉移至 Cloud Storage,除了一般費用外,Storage 移轉服務會使用 Cloud Storage rewrite 作業在 Cloud
2024/11/05
使用 Storage Transfer 服務是否能降低成本? Storage Transfer 的計價方式針對從 Cloud Storage 轉移至 Cloud Storage,除了一般費用外,Storage 移轉服務會使用 Cloud Storage rewrite 作業在 Cloud
看更多
你可能也想看
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
本文介紹了在K8S Cluster出現問題時,透過ETCD的備份來還原Cluster的方法。包括ETCD的資料類型、備份、還原以及相關建議,並提出了自動進行ETCD備份作業和備份存放位置的重要性。
Thumbnail
本文介紹了在K8S Cluster出現問題時,透過ETCD的備份來還原Cluster的方法。包括ETCD的資料類型、備份、還原以及相關建議,並提出了自動進行ETCD備份作業和備份存放位置的重要性。
Thumbnail
資料庫之備份工作大都是自動執行,但是執行結果是否成功,需要安排人員去檢查,有時疏忽忘記確認作業,致備份工作失敗仍不知道,等到有一天需要回復舊有資料的場合時,才發現找不到過去某段期間的備份資料,造成無法彌補之後果。   2.    改善: 2.1 設計一執行檔,功能為打開備
Thumbnail
資料庫之備份工作大都是自動執行,但是執行結果是否成功,需要安排人員去檢查,有時疏忽忘記確認作業,致備份工作失敗仍不知道,等到有一天需要回復舊有資料的場合時,才發現找不到過去某段期間的備份資料,造成無法彌補之後果。   2.    改善: 2.1 設計一執行檔,功能為打開備
Thumbnail
新加入的指標 VolumeStalledIOCheck: 此指標是二進位值,將根據 EBS 磁碟區是否可以完成 I/O 操作傳回 0(通過)或 1(失敗)狀態。 可能原因: EBS 磁碟區底層儲存子系統的硬體或軟體問題 實體主機上的硬體問題會影響 EC2 執行個體中的 EBS 磁碟區
Thumbnail
新加入的指標 VolumeStalledIOCheck: 此指標是二進位值,將根據 EBS 磁碟區是否可以完成 I/O 操作傳回 0(通過)或 1(失敗)狀態。 可能原因: EBS 磁碟區底層儲存子系統的硬體或軟體問題 實體主機上的硬體問題會影響 EC2 執行個體中的 EBS 磁碟區
Thumbnail
該服務透過記錄在AWS控制台上執行的操作並產生範例程式碼來實現 Infrastructure as Code (IaC) 目前僅在 us-east-1 的 EC2 控制台上可用 支援的格式: CDK(Java) CDK(Python) CDK(TypeScript) CloudFor
Thumbnail
該服務透過記錄在AWS控制台上執行的操作並產生範例程式碼來實現 Infrastructure as Code (IaC) 目前僅在 us-east-1 的 EC2 控制台上可用 支援的格式: CDK(Java) CDK(Python) CDK(TypeScript) CloudFor
Thumbnail
知道如何備份與還原ETCD才能確保當環境出現重大問題時,可以將你的環境回復回來,對於系統管理者來說,等於是救人一命。(認真來說其實也是救了你的主管一命)。
Thumbnail
知道如何備份與還原ETCD才能確保當環境出現重大問題時,可以將你的環境回復回來,對於系統管理者來說,等於是救人一命。(認真來說其實也是救了你的主管一命)。
Thumbnail
AWS AMI Oracle Linux 7 包成 AMI 後,使用 AMI 啟動新 EC2 會遇到 Instance status checks fail 的問題 查看 system log 看到 EC2 開機時沒有抓到 eth0 ,導致 Instance status checks fai
Thumbnail
AWS AMI Oracle Linux 7 包成 AMI 後,使用 AMI 啟動新 EC2 會遇到 Instance status checks fail 的問題 查看 system log 看到 EC2 開機時沒有抓到 eth0 ,導致 Instance status checks fai
Thumbnail
AWS 佈署簡單操作以及 RDS 建立篇
Thumbnail
AWS 佈署簡單操作以及 RDS 建立篇
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News