Azure - Operations Manager(SCOM)

更新於 發佈於 閱讀時間約 9 分鐘

SCOM (司康m) 指的是在Microsoft System Center內的一個元件 Operations Manager,簡稱SCOM。主要就是用來監控資訊環境的健康狀態、效能、可用性等等...,並可以發出告警alert,透過匯入Management Packs到要監控的目標object來達成。

The Operations Manager infrastructure

SCOM的基礎設施架構,安裝Operations Manager會創建一個management group的概念,是此功能的基本單位,最基本包含三個部分:management server, operational database與reporting data warehouse database。

  1. Management server(MS): management group可以包含有多個MS變成資源池,有HA的功能,新加入的也能自動接手負載,但不會同時處理同一個object,使用operation console連線到management group內的MS,並作為management group與database中間的溝通。
  2. Operational database : (SQL Server),保存設定檔,與”近期、短期”的監控資料,預設為7天
  3. Reporting data warehouse database: (SQL Server),儲存”歷史”監控與告警的資料,當資料寫入時會同時寫入operational database與DW database,所以DW資料庫也同時保存著目前的資料。

如果安裝了Operations Manager reporting functionality,那就會有一個report server,而report server 的資料就是從DW database 來的。


raw-image

Management servers(MS)

管理management group配置、管理agents並與agents進行通信,以及與management group中的Database進行通信,是資源池概念。有一種為gateway server 用來處理、監控位於untrusted domains的機器。

Agents

Agent安裝在computer上面來收集資料,與預設資料比對,建立告警,run responses,manager server 接收與發送資料到computer上面的agent,agent可以設定為proxy agent,可以用來監控無法安裝agent 的computer。

Service

Agent 以service的形式跑在受監控的computer,為"Microsoft Monitoring Agent service",用來收集效能資訊、執行任務等等。當service無法與MS溝同時,這個service也會持續執行並將這些收集來的資料與事件(event)queue住。等到連線恢復, Microsoft Monitoring Agent service就會再次發送這些資料到MS。

Microsoft Monitoring Agent service在同時也會跑在MS 上面,用來執行workflows與管理credentials,service使用特定的credential來發起MonitoringHost.exe這process,這些procrsses監控並收集event log ,統計效能資訊,Windows Management Instrumentation (WMI),與執行一些像是script的action。

MS 也會執行System Center Data Access service 與 System Center Management Configuration service。

  • System Center Data Access service: 提供Operations console 存取operational database.
  • System Center Management Configuration service: 管理management group,也可以配送management packs到欲管理的objects

Management packs(MP)

System Center MS所執行的workflows 就是由MP所定義,MP依照不同的應用程式與技術,定義了agent要收集與送往MS 的資訊。

Operations Manager 在計算機上安裝Agent後,它會向Agent發送初始配置。初始配置包括來自管理包的object discoveries。管理包定義了計算機上監視的目標是屬於哪種類型,例如是何種應用程序和什麼功能。Agent會再將這些數據發送到MS,以識別在計算機上發現的對象。然後MS再向Agent發送適用於每台計算機的已發現對象的管理包元素,例如rules 與 monitors。

一個rule定義了從電腦收集的事件和性能數據,與依據這些收集數據後要做什麼?簡單來說就是 If/Then的語句。例如,應用程序的管理包可能包含如下rule:

  • 如果在事件日誌中發現應用程序正在關閉,就創建警報。
  • 如果源文件上傳失敗,則收集此失敗的事件。

規則可以創建警報、收集事件或效能數據,在發送到MS。rule還可以運行腳本,例如嘗試重新啟動失敗的應用程序。

Discovered objects有不同的健康狀態,會在Operations console顯示為:

  • 綠色(successful or healthy)
  • 黃色(warning)
  • 紅色(critical or unhealthy)

例如,磁盤容量監視器可能將綠色定義為小於 85%,黃色定義為超過 85%,紅色定義為超過 90%。監視器可以設定當發生狀態更改時生成警報。


raw-image
  1. 設定 Operations Manager 去搜索要管理的計算機。
  2. 識別符合指定條件且尚未管理的計算機。
  3. 安裝Operations Manager Agent在發現的計算機上。
  4. Agent請求配置數據,然後MS從包含要發現的類別(classes)的MP發送給Agent配置數據。例如,如果安裝了 Windows Server 操作系統MP,MS將向Agent發送操作系統的類別。
  5. Agent將配置數據與計算機進行比較,識別它發現的任何對象,並將信息返回給管理服務器。例如,Agent將向MS發送出計算機上有 Windows Server 2016 操作系統的實例。
  6. MS將已安裝管理包的所有監控邏輯發送給Agent,這些邏輯適用於發現的對象。例如,代理將接收適用於 Windows Server 2016 的所有監視邏輯。
  7. Agent用監控邏輯,例如rules 與 monitors,運行workflows,並將數據返回到MS。
  8. 當發現的對象發生變化時,例如添加或卸載應用程序,Agent將更新的信息發送到MS,然後MS發送更新的監控邏輯。


Agents 與 Management servers 之間的通信

Operations Manager agent將警報和數據發送到主要的MS,再將數據寫入operational database。Agent還將事件、性能和狀態數據發送到該agent的MS,將數據同時寫入operational database與data warehouse databases。

代理根據每個rule和monitor的排程參數發送數據。對於收集規則的優化,當計樣本的數量與前一個樣本相差到達一定的值(例如 10%)時才傳輸數據。有助於減少網絡流量和存儲在操作數據庫中的數據量。

此外,所有agent都會定期向MS發送一個稱為“heartbeat”的packet,默認情況下每 60 秒發送一次。heartbeat的目的是驗證agent的可用性以及與MS之間的通信。

對於每個agent,Operations Manager 運行一個health service watcher,它從MS的角度監視遠程健康服務的狀態。


資料來源: Operations Manager


留言
avatar-img
留言分享你的想法!
avatar-img
工程師Kxodia的技術報告的沙龍
4會員
13內容數
2022/04/08
今天新安裝一台11024的Oracle RAC DB 在AIX的環境 並要更新PSU到 root> /oracle/11.2.0/grid/OPatch/opatch auto /source/oracle/30501155 -ocmrf /tmp/ocm.f zizhoho@gmail.com
2022/04/08
今天新安裝一台11024的Oracle RAC DB 在AIX的環境 並要更新PSU到 root> /oracle/11.2.0/grid/OPatch/opatch auto /source/oracle/30501155 -ocmrf /tmp/ocm.f zizhoho@gmail.com
2022/03/31
今天在第一個節點發現有wait event read by other session 與DB file sequential read幾乎佔據了80% 的DB time。 研究一下這是兩個session引發的問題,以session執行的動作又有不同的現象 查一下buffer裝啥囉~ 持續調查!
2022/03/31
今天在第一個節點發現有wait event read by other session 與DB file sequential read幾乎佔據了80% 的DB time。 研究一下這是兩個session引發的問題,以session執行的動作又有不同的現象 查一下buffer裝啥囉~ 持續調查!
2022/03/14
今天要將oracle goldengate 的extract 從classic 轉成integrated mode. 真是簡單的任務阿~ 趕緊做完下班囉~ 結果! 裡面有如何轉換的步驟,排錯的方式就是將Extract 重新打開讓他跑一下,追上就好了,但! 如果這樣就好我還寫個屁? 下班!
Thumbnail
2022/03/14
今天要將oracle goldengate 的extract 從classic 轉成integrated mode. 真是簡單的任務阿~ 趕緊做完下班囉~ 結果! 裡面有如何轉換的步驟,排錯的方式就是將Extract 重新打開讓他跑一下,追上就好了,但! 如果這樣就好我還寫個屁? 下班!
Thumbnail
看更多
你可能也想看
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
在當今快節奏的企業世界中,有效管理辦公室的會議室對於保持生產力和促進無縫協作至關重要。 Offision作為領先的辦公室預約系統,深知提供可自定義的資源規則的重要性。透過允許管理員設定不同的資源預約規則,Offision讓組織能夠優化資源分配,提升整體運營效率。 本文將探討不同的預約規則的重
Thumbnail
在當今快節奏的企業世界中,有效管理辦公室的會議室對於保持生產力和促進無縫協作至關重要。 Offision作為領先的辦公室預約系統,深知提供可自定義的資源規則的重要性。透過允許管理員設定不同的資源預約規則,Offision讓組織能夠優化資源分配,提升整體運營效率。 本文將探討不同的預約規則的重
Thumbnail
Offision是專為Microsoft Teams設計的一款創新應用程式,提供無縫和高效的辦公桌預約和辦公室管理解決方案。 瞭解如何使用Offision優化辦公空間,增強團隊協作,並實現靈活的工作安排。
Thumbnail
Offision是專為Microsoft Teams設計的一款創新應用程式,提供無縫和高效的辦公桌預約和辦公室管理解決方案。 瞭解如何使用Offision優化辦公空間,增強團隊協作,並實現靈活的工作安排。
Thumbnail
Fleet Manager (AWS Systems Manager 的功能) 是統一的使用者界面 (UI) 體驗,可助您遠端管理在 AWS 或內部部署上執行的受管節點 利用 Fleet Manager,您可以從單一主控台檢視整個伺服器機群的運作狀態和效能狀態 Fleet Manager 有哪些
Thumbnail
Fleet Manager (AWS Systems Manager 的功能) 是統一的使用者界面 (UI) 體驗,可助您遠端管理在 AWS 或內部部署上執行的受管節點 利用 Fleet Manager,您可以從單一主控台檢視整個伺服器機群的運作狀態和效能狀態 Fleet Manager 有哪些
Thumbnail
句式範本 管理層面:制定……;安排……;佈置……;指導……;批准…… 業務層面:執行……;完成……;開展……;聽取……;提交…… 高級詞彙 針對制度、方案、計畫等檔:草擬、起草、擬訂、編制、制訂、擬定、審定、審核、審查、轉呈、轉交、提交、呈報、下達、備案、存檔、提出意見 針對資訊、資料
Thumbnail
句式範本 管理層面:制定……;安排……;佈置……;指導……;批准…… 業務層面:執行……;完成……;開展……;聽取……;提交…… 高級詞彙 針對制度、方案、計畫等檔:草擬、起草、擬訂、編制、制訂、擬定、審定、審核、審查、轉呈、轉交、提交、呈報、下達、備案、存檔、提出意見 針對資訊、資料
Thumbnail
管理就是把複雜的問題簡單化,混亂的事情規範化 | 在原本的職位苦幹實幹了兩年,從當時原本患有數據盲的菜雞逐漸進化為火眼金睛,大致模熟了負責業務的各種細節,經歷過老鳥的離巢,也挺過大小節點與流程變動,但畢竟上班跟上廁所一樣總有永遠擦不完的屁股......
Thumbnail
管理就是把複雜的問題簡單化,混亂的事情規範化 | 在原本的職位苦幹實幹了兩年,從當時原本患有數據盲的菜雞逐漸進化為火眼金睛,大致模熟了負責業務的各種細節,經歷過老鳥的離巢,也挺過大小節點與流程變動,但畢竟上班跟上廁所一樣總有永遠擦不完的屁股......
Thumbnail
大道至簡,偉大的道理可以被簡單說才能流傳。 開始做就對了。 工具好書分享:OGSM打造高敏捷團隊 作者:張敏敏 商業周刊出版 坊間管理書籍百百種,工具類別更不在少數,不過很多看的時候感動萬分,做起來三分鐘就放棄。 在沒有專業顧問的協助下,的確不容易成局。這本書籍倒是打破這樣的限制,從容易執行的架構開
Thumbnail
大道至簡,偉大的道理可以被簡單說才能流傳。 開始做就對了。 工具好書分享:OGSM打造高敏捷團隊 作者:張敏敏 商業周刊出版 坊間管理書籍百百種,工具類別更不在少數,不過很多看的時候感動萬分,做起來三分鐘就放棄。 在沒有專業顧問的協助下,的確不容易成局。這本書籍倒是打破這樣的限制,從容易執行的架構開
Thumbnail
OGSM是能夠用在公司經營、專案執行含人生規劃的工具,把所有重的項目,都列在一張表格之中,完美達成公司理念 透過Object最終目的、Goal目標、Strategy策略、Measure檢核四個指標,可以自我反思,也可以與人溝通,運用在生涯規劃上,可以讓你的每一個行動,都都能達成你的人生意義
Thumbnail
OGSM是能夠用在公司經營、專案執行含人生規劃的工具,把所有重的項目,都列在一張表格之中,完美達成公司理念 透過Object最終目的、Goal目標、Strategy策略、Measure檢核四個指標,可以自我反思,也可以與人溝通,運用在生涯規劃上,可以讓你的每一個行動,都都能達成你的人生意義
Thumbnail
SCOM指的是在Microsoft System Center內的一個元件 Operations Manager,簡稱SCOM。主要就是用來監控資訊環境的健康狀態、效能、可用性等等...,並可以發出告警alert,透過匯入Management Packs到要監控的目標object來達成
Thumbnail
SCOM指的是在Microsoft System Center內的一個元件 Operations Manager,簡稱SCOM。主要就是用來監控資訊環境的健康狀態、效能、可用性等等...,並可以發出告警alert,透過匯入Management Packs到要監控的目標object來達成
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News