Amazon CloudWatch 新增 Metrics 可以監控 EBS 運作狀況(實用)

更新於 發佈於 閱讀時間約 2 分鐘


新加入的指標

VolumeStalledIOCheck

此指標是二進位值,將根據 EBS 磁碟區是否可以完成 I/O 操作傳回 0(通過)或 1(失敗)狀態。

可能原因:

  • EBS 磁碟區底層儲存子系統的硬體或軟體問題
  • 實體主機上的硬體問題會影響 EC2 執行個體中的 EBS 磁碟區的可及性
  • 實例和 EBS 磁碟區之間的連線問題

如果VolumeStalledIOCheck指標失敗,您可以等待 AWS 解決問題,也可以採取措施,例如取代受影響的磁碟區或停止並重新啟動該磁碟區所附加的執行個體。在大多數情況下,當該指標失敗時,EBS 將在幾分鐘內自動診斷並恢復您的磁碟區[1]。


StatusCheckFailed_AttachedEBS

該指標監控您的 EBS 磁碟區是否正確連接到 EC2 執行個體並且可以正確執行 I/O 操作

以下是可能導致附加 EBS 狀態檢查失敗的問題範例:

  • EBS 磁碟區底層儲存子系統的硬體或軟體問題
  • 實體主機上影響 EBS 磁碟區的可及性的硬體問題
  • 實例和 EBS 磁碟區之間的連線問題

您可以使用該StatusCheckFailed_AttachedEBS指標來幫助提高工作負載的彈性。


兩者差異

VolumeStalledIOCheck它是AWS/EBS指標

StatusCheckFailed_AttachedEBS它是AWS/EC2指標


如圖可以看到兩個指標都是健康狀態

raw-image


我們可以使用 AWS Fault Injection Service [3] 服務,可以模擬 EBS 磁碟區上的 I/O 停止,來檢查指標是否會改變

raw-image

選擇測試時間,測試費用可以幫您估算

raw-image

可以看到對於EBS 一分鐘的I/O 停止,對於StatusCheckFailed_AttachedEBS 較無反應

raw-image

那停止 6 分鐘,就可以看到兩種指標都會知道目前 EBS 都出狀況,建議兩種都要同時監控

raw-image


目前只有使用 Nitro 系統建置的實例才符合資格。


[1] https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-io-characteristics.html#ebs-io-metrics

[2] https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/monitoring-system-instance-status-check.html#attached-ebs-status-checks

[3] https://aws.amazon.com/tw/fis/

avatar-img
16會員
80內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
西尼亞ming的沙龍 的其他內容
該服務透過記錄在AWS控制台上執行的操作並產生範例程式碼來實現 Infrastructure as Code (IaC) 目前僅在 us-east-1 的 EC2 控制台上可用 支援的格式: CDK(Java) CDK(Python) CDK(TypeScript) CloudFor
Lambda Log 是存放至 CloudWatch Logs, 格式跟log level只能預設,但現今是可以修改的 Log 格式:Text Log level:無 Log Group :/aws/lambda/Function Name 實驗開始 新建立測試Functi
使用 AWS Chatbot 的 Slack 結合使用 Amazon Q ,可以從 Slack 中提問。 實作開始 來到 AWS Chatbot,Chat client 選擇 Slack 點擊後,會跳到 Slack 授權 新增工作區後,需新增channel 輸入名子跟 Channel
Cloudwatch Logs 中新增了用於不頻繁存取的日誌類別 Infrequent Access  透過使用新的類別 Infrequent Access,資料傳輸費用現在減半 Infrequent Access 功能有限,訂閱過濾器、指標過濾器等很多功能無法使用 無法變更現有日誌組
Amazon Q offers help to optimize EC2 instance type selection (preview) https://aws.amazon.com/tw/about-aws/whats-new/2023/11/amazon-q-optimal-ec2-i
AWS Certificate Manager 頒發的 Public 憑證是透過 Amazon Trust Services(由 Amazon 管理的憑證授權單位)頒發的。 如果需要 Amazon Trust Services 證書,請從Amazon Trust Services Reposi
該服務透過記錄在AWS控制台上執行的操作並產生範例程式碼來實現 Infrastructure as Code (IaC) 目前僅在 us-east-1 的 EC2 控制台上可用 支援的格式: CDK(Java) CDK(Python) CDK(TypeScript) CloudFor
Lambda Log 是存放至 CloudWatch Logs, 格式跟log level只能預設,但現今是可以修改的 Log 格式:Text Log level:無 Log Group :/aws/lambda/Function Name 實驗開始 新建立測試Functi
使用 AWS Chatbot 的 Slack 結合使用 Amazon Q ,可以從 Slack 中提問。 實作開始 來到 AWS Chatbot,Chat client 選擇 Slack 點擊後,會跳到 Slack 授權 新增工作區後,需新增channel 輸入名子跟 Channel
Cloudwatch Logs 中新增了用於不頻繁存取的日誌類別 Infrequent Access  透過使用新的類別 Infrequent Access,資料傳輸費用現在減半 Infrequent Access 功能有限,訂閱過濾器、指標過濾器等很多功能無法使用 無法變更現有日誌組
Amazon Q offers help to optimize EC2 instance type selection (preview) https://aws.amazon.com/tw/about-aws/whats-new/2023/11/amazon-q-optimal-ec2-i
AWS Certificate Manager 頒發的 Public 憑證是透過 Amazon Trust Services(由 Amazon 管理的憑證授權單位)頒發的。 如果需要 Amazon Trust Services 證書,請從Amazon Trust Services Reposi
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
遇到問題: root@b10000ea1f5b:/app/backend# ollama run phi3:14b pulling manifest pulling 7a3cc4804c64... 98% ▕███████████████████████████████████████ ▏
Thumbnail
玩完PVE到搭個NAS,今次用OpenMediaVault。 又係Debian base,太懶,係咁禁Next,一大隻Partition過,結果中晒伏。 Storage/File Systems 搵唔到 / 個file system,Google左輪,搵唔到。試下搞下fstab,除左會開
Thumbnail
Cloud Run 允許您指定哪些修訂版應該接收流量,並指定不同版本接收的流量比例。Revisions 也能使您能夠回滾到先前的版本、逐步增加新版本的流量比例,或在多個修訂版之間拆分流量。
Thumbnail
每日自動檢查資料庫運作所產生的訊息,若發現有錯誤,自動寄出警告信給擔當人員
Thumbnail
本文介紹了在K8S Cluster出現問題時,透過ETCD的備份來還原Cluster的方法。包括ETCD的資料類型、備份、還原以及相關建議,並提出了自動進行ETCD備份作業和備份存放位置的重要性。
Thumbnail
打開 PowerShell 關閉wsl  wsl --shutdown 執行: Set-ExecutionPolicy RemoteSigned -Scope CurrentUser iwr -useb https://raw.githubusercontent.com/okibcn/wslc
Thumbnail
資料庫之備份工作大都是自動執行,但是執行結果是否成功,需要安排人員去檢查,有時疏忽忘記確認作業,致備份工作失敗仍不知道,等到有一天需要回復舊有資料的場合時,才發現找不到過去某段期間的備份資料,造成無法彌補之後果。   2.    改善: 2.1 設計一執行檔,功能為打開備
Thumbnail
常在用一些軟體轉移系統區到新的SSD後,在DiskGenius裡面會顯示ESP(損壞),但系統又能正常開機,網路上找到可以修復的方式來紀錄一下。 要準備的軟體是DiskGenius,這裡是5.5.1.1508 最新版; 以及Dism++10.1.1002.1B,兩者都建議別用太舊版本。 首先打
Thumbnail
分享關於 AWS CLF-C02 考試的準備心得,包括考試主要範圍、準備過程中的學習資源及建議,以及考試當日的流程和心得。希望本文能為欲嘗試取得此認證的人提供心得與參考。
Thumbnail
在企業IT環境,系統和數據的備份的重要性相信是不用解說,亦不用懷疑的。 但很時時候,企業忽略的並不是備份,而是Drill test的重要性。
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
遇到問題: root@b10000ea1f5b:/app/backend# ollama run phi3:14b pulling manifest pulling 7a3cc4804c64... 98% ▕███████████████████████████████████████ ▏
Thumbnail
玩完PVE到搭個NAS,今次用OpenMediaVault。 又係Debian base,太懶,係咁禁Next,一大隻Partition過,結果中晒伏。 Storage/File Systems 搵唔到 / 個file system,Google左輪,搵唔到。試下搞下fstab,除左會開
Thumbnail
Cloud Run 允許您指定哪些修訂版應該接收流量,並指定不同版本接收的流量比例。Revisions 也能使您能夠回滾到先前的版本、逐步增加新版本的流量比例,或在多個修訂版之間拆分流量。
Thumbnail
每日自動檢查資料庫運作所產生的訊息,若發現有錯誤,自動寄出警告信給擔當人員
Thumbnail
本文介紹了在K8S Cluster出現問題時,透過ETCD的備份來還原Cluster的方法。包括ETCD的資料類型、備份、還原以及相關建議,並提出了自動進行ETCD備份作業和備份存放位置的重要性。
Thumbnail
打開 PowerShell 關閉wsl  wsl --shutdown 執行: Set-ExecutionPolicy RemoteSigned -Scope CurrentUser iwr -useb https://raw.githubusercontent.com/okibcn/wslc
Thumbnail
資料庫之備份工作大都是自動執行,但是執行結果是否成功,需要安排人員去檢查,有時疏忽忘記確認作業,致備份工作失敗仍不知道,等到有一天需要回復舊有資料的場合時,才發現找不到過去某段期間的備份資料,造成無法彌補之後果。   2.    改善: 2.1 設計一執行檔,功能為打開備
Thumbnail
常在用一些軟體轉移系統區到新的SSD後,在DiskGenius裡面會顯示ESP(損壞),但系統又能正常開機,網路上找到可以修復的方式來紀錄一下。 要準備的軟體是DiskGenius,這裡是5.5.1.1508 最新版; 以及Dism++10.1.1002.1B,兩者都建議別用太舊版本。 首先打
Thumbnail
分享關於 AWS CLF-C02 考試的準備心得,包括考試主要範圍、準備過程中的學習資源及建議,以及考試當日的流程和心得。希望本文能為欲嘗試取得此認證的人提供心得與參考。
Thumbnail
在企業IT環境,系統和數據的備份的重要性相信是不用解說,亦不用懷疑的。 但很時時候,企業忽略的並不是備份,而是Drill test的重要性。