更新於 2024/06/20閱讀時間約 10 分鐘

〔學習筆記〕Dynatrace:Gen3現代化應用程式監控平台簡介

raw-image

什麼是dynatrace?

dynatrace在Gartner的分類是屬於APM(應用程式效能監控)的類別。

Gartner defines the application performance monitoring (APM) and observability market as software that enables the observation and analysis of application health, performance and user experience. The targeted roles are IT operations, site reliability engineers, cloud and platform teams, application developers, and product owners.

其中APM或可觀察性(observability)工具應該要包括以下功能:

  • 觀察應用程式的完整事務行為(transactional behavior)
  • 自動發現和拓樸應用程式和基礎設施依賴關係(包括雲原生架構)
  • 監控行動設備(mobile )和桌面瀏覽器(desktop browsers)上運行的應用程式
  • 識別和分析應用程序性能問題及其對業務成果的影響
  • 與自動化和服務管理工具整合之外,與公共雲廠商的服務整合,例如 Amazon CloudWatch、Microsoft Azure Monitor 和 Google Cloud Operations
  • 可以分析業務關鍵績效指標 (KPI) 和用戶旅程

但除了APM(Application Performance Monitoring),Dynatrace也把觸角伸向:

  • Network monitoring
  • Infrastructure monitoring
  • Digital Experience monitoring
  • Cloud Automation
  • Application Security

總之就是希望建立一個監控的大平台,收集IT環境裡面的所有數據,並透過dynatrace裡面的AI DAVIS機器學習,去做告警甚至是自動化修復,減少IT人力去做維運而去做更高產值的業務,甚至也希望透過dynatrace更進一步提供商業上的決策見解。

2023 Magic Quadrant for Application Performance Monitoring and Observability


Dynatrace的架構

Dynatrace 提供兩種主要部署選項:Dynatrace ManagedDynatrace SaaS(Software as a Service)。這兩種選項在許多方面都有不同,以下是它們的各方面差異:

部署方式

    • Dynatrace Managed:這是自主部署的選項,需要在自己的主機(Linux only)中設置和管理Dynatrace環境。這種方式提供了更大的控制權,但需要更多的資源和人力來進行設置、升級和維護。
    • Dynatrace SaaS:這是一種基於雲端的解決方案,Dynatrace 公司負責管理和運維整個環境。這減輕了組織的管理負擔,同時提供了更快的部署速度和即時更新。

部署速度和複雜性

    • Dynatrace Managed:需要組織自行設置和配置硬體、網絡和軟體,這可能需要更長的時間,特別是在大型和複雜的環境中。
    • Dynatrace SaaS:由於基於雲端,部署速度較快且較簡單,無需煩惱硬體和基礎設施的事宜。

可擴展性

    • Dynatrace Managed:組織需要自行確保所選擇的硬體和基礎設施能夠支援預期的工作負載。(自行購買硬體資源)
    • Dynatrace SaaS:由於基於雲端,可以更容易地進行水平擴展,無需太多的 IT 管理和規劃。

安全性

    • Dynatrace Managed:組織需要自行負責實施安全措施,包括網絡安全、防火牆配置等,可將dynatrace server(監控資料)放於內網內,但是要對外連線Dynatrace的Mission Control,以利軟體更新和檢查授權。
    • Dynatrace SaaS:Dynatrace 負責保護整個環境的安全性,提供了多層次的安全措施和監控,但dynatrace server(監控資料)放於公有雲上

升級和更新

    • Dynatrace Managed:組織需要自行規劃和執行 Dynatrace 的升級和更新,排程在離峰時間。
    • Dynatrace SaaS:Dynatrace 公司會定期提供新功能、修補程序和性能改進,組織可以輕鬆受益於自動更新,無需額外投入人力。

整體來說,Dynatrace Managed 提供了更大的自定義和控制權,但需要更多的管理和資源。Dynatrace SaaS 則更加簡單快速,並提供了由供應商負責的管理和更新,適用於那些想要專注於應用程式和業務而不想承擔運維負擔的組織。

另外從2023年開始因為SaaS 底層存放資料的技術已經不再是Cassandra、Elasticsearch等等,而是dynatrace研發的Grail-data lake house,他能夠存放更大量、資料結構更多樣的data,導致可以倒入更多有關第一線的客戶資料、商業資訊、甚至是碳排放的資訊,SaaS 在未來會有更多的商業上實務面的應用,而不僅僅只是一個程式效能監控平台了!~

額外閱讀:SaaS versus Managed deployment comparison chart


Dynatrace的元件

以下以Dynatrace Managed的架構來解釋,因為SaaS的已經簡略許多,不須甚麼人力去維護和管理。

Dynatrace Managed託管架構

其實Dynatrace的架構並不會很複雜,簡單來說將Oneagent安裝在被監控的主機上,透過ActiveGate作為secure proxy傳輸並壓縮資料流,最後存在Managed Server上,Managed Server可以採用單一節點或是叢集的架構,使用者可以透過瀏覽器閱覽Dynatrace的UI介面,最後Managed Server需要對外連線到Dynatrace的Mission Control,以利軟體更新和檢查授權。

另外來自外網的資料、交易資訊、AP log、dynatrace的插件、mobile的資料等等的數據都會先傳到Cluster ActiveGate,主要當一個資安上的中繼站。

Dynatrace ActiveGate

ActiveGate有三種,分別是 Embedded ActiveGate、Environment ActiveGate、Cluster ActiveGate。

Embedded ActiveGate 是Managed Server組件的一部分(Dynatrace Server, Cassandra, Elasticsearch, embedded ActiveGate, NGINX),主要是負責cluster之間的資料傳輸。

Environment ActiveGateCluster ActiveGate 其實基本上大同小異,主要功能是充當secure proxycloud native平台的監控Dynatrace extension的運行...。

主要的不同在於Environment ActiveGate收攏單一監控區域的資料,Cluster ActiveGate可以收攏多個監控區域的資料,並且Cluster ActiveGate可以接收來至外網的資料,像是使用agentless real user monitoring, Mobile Real user monitoring, Sythetic monitoring...等功能。

Dynatrace OneAgent

OneAgent其實就是Dynatrace 裝在運算資源上的agent,負責收集資訊並傳回Managed Server去做後續的使用,其中和過去監控軟體的agent比較不同的是,Dynatrace 只需要安裝一種agent(顧名OneAgent),就可以涵蓋大部分的技術,以及網路監控、硬體資源監控、程式效能監控...等等

Dynatrace 為何重要?解決了甚麼問題?

在當今快速發展的軟體開發和運營領域。目前作為一個全方位的監控和性能優化解決方案,Dynatrace 解決了許多過去存在的棘手問題,為企業帶來了革命性的變革。

過去,我們經常需要花費大量的時間和資源來設置和維護監控系統。Dynatrace OneAgent,通過自動監控和配置能力,解決了這一挑戰。它能無縫地整合到各種技術環境中,從虛擬機到容器,從雲端到本地,為用戶提供了全局的可見性。這消除了複雜性帶來的障礙,使管理人員能夠透過一個統一的介面監控整個系統。

現今應用程式環境的複雜性常常讓人不堪重負,Dynatrace 提供實時的性能數據和洞察力,並擁有全堆疊(full-stack)監控能力。不僅監控應用程式層面的性能,還能深入追蹤每一個交易和操作,幫助您找出問題的根源。

另外Dynatrace還具有強大的AI根因分析(root-cause)功能,面對複雜IT環境的大量告警洪流,都能夠分析海量的數據,找到問題的根本原因,節省大量的MTTR,並提高故障排除的效率。

今年因為Dynatrace推出新的資料倉儲技術-Grail,伴隨而來許多新功能,包括AppEngine、AutomationEngine,更可以用AppEngine在Dynatrace平台內開發APP讓收集進來的資料有更多可能性,像是最近最有名的例子跨入ESG的領域,在監控IT環境的同時也幫助管理碳排的用量等等。



如果你喜歡這篇文章歡迎幫我按愛心鼓勵一下喔!~閱讀愉快!~

Ref

Critical Capabilities for Application Performance Monitoring and Observability

Magic Quadrant for Application Performance Monitoring and Observability

Dynatrace Documentation

分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.