Azure - Operations Manager(SCOM)

閱讀時間約 8 分鐘
SCOM (司康m) 指的是在Microsoft System Center內的一個元件 Operations Manager,簡稱SCOM。主要就是用來監控資訊環境的健康狀態、效能、可用性等等...,並可以發出告警alert,透過匯入Management Packs到要監控的目標object來達成。

The Operations Manager infrastructure

SCOM的基礎設施架構,安裝Operations Manager會創建一個management group的概念,是此功能的基本單位,最基本包含三個部分:management server, operational database與reporting data warehouse database。
  1. Management server(MS): management group可以包含有多個MS變成資源池,有HA的功能,新加入的也能自動接手負載,但不會同時處理同一個object,使用operation console連線到management group內的MS,並作為management group與database中間的溝通。
  2. Operational database : (SQL Server),保存設定檔,與”近期、短期”的監控資料,預設為7天
  3. Reporting data warehouse database: (SQL Server),儲存”歷史”監控與告警的資料,當資料寫入時會同時寫入operational database與DW database,所以DW資料庫也同時保存著目前的資料。
如果安裝了Operations Manager reporting functionality,那就會有一個report server,而report server 的資料就是從DW database 來的。

Management servers(MS)

管理management group配置、管理agents並與agents進行通信,以及與management group中的Database進行通信,是資源池概念。有一種為gateway server 用來處理、監控位於untrusted domains的機器。

Agents

Agent安裝在computer上面來收集資料,與預設資料比對,建立告警,run responses,manager server 接收與發送資料到computer上面的agent,agent可以設定為proxy agent,可以用來監控無法安裝agent 的computer。

Service

Agent 以service的形式跑在受監控的computer,為"Microsoft Monitoring Agent service",用來收集效能資訊、執行任務等等。當service無法與MS溝同時,這個service也會持續執行並將這些收集來的資料與事件(event)queue住。等到連線恢復, Microsoft Monitoring Agent service就會再次發送這些資料到MS。
Microsoft Monitoring Agent service在同時也會跑在MS 上面,用來執行workflows與管理credentials,service使用特定的credential來發起MonitoringHost.exe這process,這些procrsses監控並收集event log ,統計效能資訊,Windows Management Instrumentation (WMI),與執行一些像是script的action。
MS 也會執行System Center Data Access service 與 System Center Management Configuration service。
  • System Center Data Access service: 提供Operations console 存取operational database.
  • System Center Management Configuration service: 管理management group,也可以配送management packs到欲管理的objects

Management packs(MP)

System Center MS所執行的workflows 就是由MP所定義,MP依照不同的應用程式與技術,定義了agent要收集與送往MS 的資訊。
Operations Manager 在計算機上安裝Agent後,它會向Agent發送初始配置。初始配置包括來自管理包的object discoveries。管理包定義了計算機上監視的目標是屬於哪種類型,例如是何種應用程序和什麼功能。Agent會再將這些數據發送到MS,以識別在計算機上發現的對象。然後MS再向Agent發送適用於每台計算機的已發現對象的管理包元素,例如rules 與 monitors。
一個rule定義了從電腦收集的事件和性能數據,與依據這些收集數據後要做什麼?簡單來說就是 If/Then的語句。例如,應用程序的管理包可能包含如下rule:
  • 如果在事件日誌中發現應用程序正在關閉,就創建警報。
  • 如果源文件上傳失敗,則收集此失敗的事件。
規則可以創建警報、收集事件或效能數據,在發送到MS。rule還可以運行腳本,例如嘗試重新啟動失敗的應用程序。
Discovered objects有不同的健康狀態,會在Operations console顯示為:
  • 綠色(successful or healthy)
  • 黃色(warning)
  • 紅色(critical or unhealthy)
例如,磁盤容量監視器可能將綠色定義為小於 85%,黃色定義為超過 85%,紅色定義為超過 90%。監視器可以設定當發生狀態更改時生成警報。
How objects are discovered and monitored
  1. 設定 Operations Manager 去搜索要管理的計算機。
  2. 識別符合指定條件且尚未管理的計算機。
  3. 安裝Operations Manager Agent在發現的計算機上。
  4. Agent請求配置數據,然後MS從包含要發現的類別(classes)的MP發送給Agent配置數據。例如,如果安裝了 Windows Server 操作系統MP,MS將向Agent發送操作系統的類別。
  5. Agent將配置數據與計算機進行比較,識別它發現的任何對象,並將信息返回給管理服務器。例如,Agent將向MS發送出計算機上有 Windows Server 2016 操作系統的實例。
  6. MS將已安裝管理包的所有監控邏輯發送給Agent,這些邏輯適用於發現的對象。例如,代理將接收適用於 Windows Server 2016 的所有監視邏輯。
  7. Agent用監控邏輯,例如rules 與 monitors,運行workflows,並將數據返回到MS。
  8. 當發現的對象發生變化時,例如添加或卸載應用程序,Agent將更新的信息發送到MS,然後MS發送更新的監控邏輯。

Agents 與 Management servers 之間的通信

Operations Manager agent將警報和數據發送到主要的MS,再將數據寫入operational database。Agent還將事件、性能和狀態數據發送到該agent的MS,將數據同時寫入operational database與data warehouse databases。
代理根據每個rule和monitor的排程參數發送數據。對於收集規則的優化,當計樣本的數量與前一個樣本相差到達一定的值(例如 10%)時才傳輸數據。有助於減少網絡流量和存儲在操作數據庫中的數據量。
此外,所有agent都會定期向MS發送一個稱為“heartbeat”的packet,默認情況下每 60 秒發送一次。heartbeat的目的是驗證agent的可用性以及與MS之間的通信。
對於每個agent,Operations Manager 運行一個health service watcher,它從MS的角度監視遠程健康服務的狀態。
資料來源: Operations Manager
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
本文介紹了使用Azure Site Recovery service - Classic 在本地 VMware 和 Azure 之間部署災難恢復複製(disaster recovery replication )、故障轉移(failover)和恢復(recovery)時使用的架構和流程。
本文介紹了使用Azure Site Recovery service - Classic 在本地 VMware 和 Azure 之間部署災難恢復複製(disaster recovery replication )、故障轉移(failover)和恢復(recovery)時使用的架構和流程。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
今年兩場關於Cloud的演講,我主要針對使用PaaS服務作為一個議題,會有PaaS應用的議題,主要來自自己觀察企業運用雲端資源模式,也來自於實務經驗,發現採用PaaS服務,可以比使用IaaS服務的費用下降了30~40 %。雲概念越來越普及,但是企業要怎樣用雲的資源幫助企業轉型,或許還在一個模糊的階段
Thumbnail
在雲端建立AKS後,運行後有許多Container會被外部服務呼叫使用。但我們知道當我們佈署到AKS,如果要被外面服務呼叫,就要在YAML將Type設定成Loadbalance,一旦這樣設定,就會變成每個Container就會多出一個對外的IP,Container變多了,對外IP就會擴增很快,也不好
Thumbnail
隨著雲端概念越來越普及,Azure 作為一個雲端平台,已逐漸演變成為一個高度複雜的架構。早期的 Azure 概念是讓使用者在雲端上開啟所需的資源並建立相關的服務,同時也不需要自行建構機房等基礎設施,因此具有相當的優勢。但是隨著時間的推移,雲端的應用也越來越廣泛,因此 Azure 也提供了許多指導方式
Thumbnail
如果想看官方文件的話~ 請看 使用 Azure 監視器監視虛擬機器,我是有看沒有懂啦~ 以下,我直接以我能了解的方式,進行實作。 一般而言,從「概觀」功能下的「監視」~可以看到一些主機的運行狀況。
Thumbnail
承上篇,繼續往下走吧! 來說明一下 PHP 兩個會用到的套件安裝,一個是 ionCube,另一個為 memcached ●PHP 套件 ionCube 安裝 先以下列指令,在帳戶內建立一個 tmp 資料夾備用,執行時留意是在帳號剛登入主機的位置喔!
Thumbnail
MongoDB 在排序時會將資料全部載入記憶體,之後在記憶體中進行排序,而預設開放給排序的記憶體只有 32 MB,因此在大量資料排序時就會引發該錯誤。
Thumbnail
這篇分享希望能讓你了解 Microsoft Azure Associate(AZ-104)考試時間、題數與 形式,希望可以給予正在準備的你一些幫助 本篇會從三個面向來分享: 1. 考試範圍與流程 2. 我是如何自學與準備 3. 給正在準備的你一些建議
Thumbnail
這篇分享希望能讓你了解 一個朝九晚九、工作與雲端甚少相關的普通上班族,如何在40小時內自學考取Microsoft Azure Fundamentals(AZ-900),若你和我一樣,這篇心得或許能夠幫助你少走一點冤枉 路~ 本篇會從四個面向來分享: 1. 為何需要考取AZ-900 2. 考試範圍與
Thumbnail
這是關於一個Dynamics 365 Finance and operations這套Microsoft ERP系統技術顧問的筆記
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
今年兩場關於Cloud的演講,我主要針對使用PaaS服務作為一個議題,會有PaaS應用的議題,主要來自自己觀察企業運用雲端資源模式,也來自於實務經驗,發現採用PaaS服務,可以比使用IaaS服務的費用下降了30~40 %。雲概念越來越普及,但是企業要怎樣用雲的資源幫助企業轉型,或許還在一個模糊的階段
Thumbnail
在雲端建立AKS後,運行後有許多Container會被外部服務呼叫使用。但我們知道當我們佈署到AKS,如果要被外面服務呼叫,就要在YAML將Type設定成Loadbalance,一旦這樣設定,就會變成每個Container就會多出一個對外的IP,Container變多了,對外IP就會擴增很快,也不好
Thumbnail
隨著雲端概念越來越普及,Azure 作為一個雲端平台,已逐漸演變成為一個高度複雜的架構。早期的 Azure 概念是讓使用者在雲端上開啟所需的資源並建立相關的服務,同時也不需要自行建構機房等基礎設施,因此具有相當的優勢。但是隨著時間的推移,雲端的應用也越來越廣泛,因此 Azure 也提供了許多指導方式
Thumbnail
如果想看官方文件的話~ 請看 使用 Azure 監視器監視虛擬機器,我是有看沒有懂啦~ 以下,我直接以我能了解的方式,進行實作。 一般而言,從「概觀」功能下的「監視」~可以看到一些主機的運行狀況。
Thumbnail
承上篇,繼續往下走吧! 來說明一下 PHP 兩個會用到的套件安裝,一個是 ionCube,另一個為 memcached ●PHP 套件 ionCube 安裝 先以下列指令,在帳戶內建立一個 tmp 資料夾備用,執行時留意是在帳號剛登入主機的位置喔!
Thumbnail
MongoDB 在排序時會將資料全部載入記憶體,之後在記憶體中進行排序,而預設開放給排序的記憶體只有 32 MB,因此在大量資料排序時就會引發該錯誤。
Thumbnail
這篇分享希望能讓你了解 Microsoft Azure Associate(AZ-104)考試時間、題數與 形式,希望可以給予正在準備的你一些幫助 本篇會從三個面向來分享: 1. 考試範圍與流程 2. 我是如何自學與準備 3. 給正在準備的你一些建議
Thumbnail
這篇分享希望能讓你了解 一個朝九晚九、工作與雲端甚少相關的普通上班族,如何在40小時內自學考取Microsoft Azure Fundamentals(AZ-900),若你和我一樣,這篇心得或許能夠幫助你少走一點冤枉 路~ 本篇會從四個面向來分享: 1. 為何需要考取AZ-900 2. 考試範圍與
Thumbnail
這是關於一個Dynamics 365 Finance and operations這套Microsoft ERP系統技術顧問的筆記