DevOps Taiwan Meetup#65 RECAP:可觀測性 Observability

更新於 發佈於 閱讀時間約 6 分鐘

這週五,我參加了人生中的第一次 DevOps Taiwan Meetup,沒想到初次體驗就撞上了最熱門的話題——可觀測性(Observability)。活動現場的熱烈程度超乎想像,甚至連走道都被坐滿了!只需要 50 元場地費,就能享受兩小時滿滿的知識密集的分享,真的讓人驚喜不已。周圍的參與者也都很厲害,以後會常常參加!希望未來也能夠有能力站上講台分享心得!

這次的主講人是 Blueswen雷N,他們帶來了許多關於 Observability 的核心要點,並展示了如何通過 Live Demo 在開發部署階段「將問題左移」,提升問題解決效率。有過 Dynatrace 經驗的我,發現很多內容與過去的實務經歷相呼應,可以舉一反三。以下是我的筆記與重點整理。

為什麼需要可觀測性?和監控有什麼差別?

監控(Monitoring) 是一種針對特定指標進行數據收集、分析和使用的過程,主要用來追蹤系統運行狀況,幫助及時發現異常並輔助決策。然而,它的數據通常與更廣泛的系統背景脫節。

可觀測性(Observability) 是指通過分析系統生成的數據(如日誌、指標和分散式追踪),來深入理解系統內部狀態的能力。它不僅能快速檢測問題,還能幫助找出問題的根本原因,特別適用於現今微服務架構下的複雜系統。

其關鍵差異,舉例來說:

1. 問題處理方式

    • 監控:「我知道可能會出問題,所以我要監控這些指標。」通過預先設置的指標進行異常檢測,例如 CPU 或記憶體使用率的警報通知。
    • 可觀測性:「我不確定會出什麼問題,但我需要足夠的信息來理解問題。」通過全面的數據收集,幫助分析問題的性質與根源。

2. 數據深度

    • 監控:關注表層數據和預定義指標。例如 CPU 使用率、記憶體使用率等監控指標。
    • 可觀測性:深入系統內部,一個 request 進來後從 end to end 完整的上下文信息。包括日誌、分布式跟踪和多層的指標(最基本的就是 log, metric, trace),反映系統內部運行(程式互相呼叫)的細節。

3. 問題診斷

    • 監控:告訴你「出了什麼問題」。比如警報通知 CPU 達到臨界值,但無法告知問題的根本原因。
    • 可觀測性:幫助你理解「為什麼出問題」以及「如何解決」。

Observability 誕生原因

當系統出現異常時,我們是否有足夠的資訊來了解發生了什麼事?這些資訊是否被妥善保存?是否有效地被利用?還是散落在各處形成了資料孤島(Data Silo),是不是能夠有效的將不同來源的資料一起顯示並關聯再一起,讓你在查找問題時能夠看到問題和根本原因的關聯性?

可觀測性(Observability)就是為了解決這些問題而生的概念,它強調透過各種資訊來清楚了解系統狀態。

可觀測性的三大支柱

可觀測性主要包含但是不限於這三種最核心的資料種類:

  1. 指標(Metrics)
    • 不同時間採樣的系統量化指標
  2. 日誌(Logs)
    • 記錄系統中發生的具體事件
  3. 分散式追蹤(Distributed Tracing)
    • 記錄請求在不同服務中的完整歷程


建置 Observability 資料流程的四個階段

可觀測性的實作可以分為四個主要階段:

  1. 生成:由各種來源產生觀測資料
  2. 收集:將資料從各處收集起來
  3. 儲存:將收集到的資料妥善保存
  4. 使用:透過各種工具分析和呈現資料


建置 Observability 的一些考量

我的 TAKEAWAY

  • 針對效率損失很有共鳴,原本很專心做一件事情,被各種環境問題或是雜事中斷真的很有感,處理完了,時間也差不多下班了、腦力也差不多歸零了
  • 在一線大廠和二線的 MTTR 差了 2.4 倍,而解問題其實大部分的時間都是用在找出根本原因(通靈)的部分,可以看到好的可觀測性帶來多少時間的效益
  • 工具很多,選擇最適合自己的最重要
  • 導入越早越好,如有成本可量,可篩選要收集哪一些資料
  • 用商業軟體真的很好用哈哈哈,像是 datadog / dynatrace 等等,工具選擇、工具的維護升級、儲存的煩惱都幫你做好了,甚至商業軟體的 agent 安裝好後,服務重啟 trace 的監控碼也都插入好了,前端後端的關聯性也整合好了!!(這邊有人 QA,講師回答可以做但是很多功夫要做)

講師的簡報資源


DevOps Taiwan Meetup 資訊

DevOps Taiwan Community | DevOps 台灣社群

DevOps Taiwan Community - KKTIX

DevOps Taiwan | Facebook

補充資料


留言
avatar-img
留言分享你的想法!
avatar-img
Marcos的方格子
23會員
44內容數
歡迎來到「Marcos的方格子」!目前在「Marcos談科技」撰寫在職涯上學習到的知識,在「Marcos談書」分享我在日常的閱讀和心得,歡迎您的到來!!
Marcos的方格子的其他內容
2024/12/14
本篇文章針對 CKA 認證考試中常見的實作題目,提供詳細解題流程與指令範例。內容基於 examtopic 題目解析,幫助考生掌握實作技能與應試技巧,快速提升 Kubernetes 操作能力,為通過 CKA 考試做好萬全準備!
Thumbnail
2024/12/14
本篇文章針對 CKA 認證考試中常見的實作題目,提供詳細解題流程與指令範例。內容基於 examtopic 題目解析,幫助考生掌握實作技能與應試技巧,快速提升 Kubernetes 操作能力,為通過 CKA 考試做好萬全準備!
Thumbnail
2024/09/17
如何一年內考取 Google Cloud 所有雲端證照
Thumbnail
2024/09/17
如何一年內考取 Google Cloud 所有雲端證照
Thumbnail
2024/09/16
Professional Data Engineer 考試/心得整理 |Google Cloud
Thumbnail
2024/09/16
Professional Data Engineer 考試/心得整理 |Google Cloud
Thumbnail
看更多
你可能也想看
Thumbnail
透過蝦皮分潤計畫,輕鬆賺取零用金!本文分享5-6月實測心得,包含數據流程、實際收入、平臺優點及注意事項,並推薦高分潤商品,教你如何運用空閒時間創造被動收入。
Thumbnail
透過蝦皮分潤計畫,輕鬆賺取零用金!本文分享5-6月實測心得,包含數據流程、實際收入、平臺優點及注意事項,並推薦高分潤商品,教你如何運用空閒時間創造被動收入。
Thumbnail
單身的人有些會養寵物,而我養植物。畢竟寵物離世會傷心,植物沒養好再接再厲就好了~(笑)
Thumbnail
單身的人有些會養寵物,而我養植物。畢竟寵物離世會傷心,植物沒養好再接再厲就好了~(笑)
Thumbnail
不知你有沒有過這種經驗?衛生紙只剩最後一包、洗衣精倒不出來,或電池突然沒電。這次一次補貨,從電池、衛生紙到洗衣精,還順便分享使用心得。更棒的是,搭配蝦皮分潤計畫,愛用品不僅自己用得安心,分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E,輕鬆上手,隨時隨地賺取分潤!
Thumbnail
不知你有沒有過這種經驗?衛生紙只剩最後一包、洗衣精倒不出來,或電池突然沒電。這次一次補貨,從電池、衛生紙到洗衣精,還順便分享使用心得。更棒的是,搭配蝦皮分潤計畫,愛用品不僅自己用得安心,分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E,輕鬆上手,隨時隨地賺取分潤!
Thumbnail
身為一個典型的社畜,上班時間被會議、進度、KPI 塞得滿滿,下班後只想要找一個能夠安靜喘口氣的小角落。對我來說,畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉,還是慢慢描繪喜歡的插畫人物,那個專注在筆觸和色彩的過程,就像在幫心靈按摩一樣,讓緊繃的神經慢慢鬆開。
Thumbnail
身為一個典型的社畜,上班時間被會議、進度、KPI 塞得滿滿,下班後只想要找一個能夠安靜喘口氣的小角落。對我來說,畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉,還是慢慢描繪喜歡的插畫人物,那個專注在筆觸和色彩的過程,就像在幫心靈按摩一樣,讓緊繃的神經慢慢鬆開。
Thumbnail
戴明強調系統運作一定會有異常,而解決問題的關鍵在於正確判明原因並提出對策。改善系統時,不應該只憑經驗,而應該依據知識理論來訂出行動方案。文章探討了事件中的特殊和共同因,並強調要讓系統回到原有的運作狀態。
Thumbnail
戴明強調系統運作一定會有異常,而解決問題的關鍵在於正確判明原因並提出對策。改善系統時,不應該只憑經驗,而應該依據知識理論來訂出行動方案。文章探討了事件中的特殊和共同因,並強調要讓系統回到原有的運作狀態。
Thumbnail
探索台灣資通安全管理法對企業和政府的影響,以及實施ISO 27001的好處。digiLogs提供一站式的日誌管理,支援各種日誌來源和格式,並提供實時異常警報,有助於滿足ISO 27001合規性要求,提高安全性和效率。
Thumbnail
探索台灣資通安全管理法對企業和政府的影響,以及實施ISO 27001的好處。digiLogs提供一站式的日誌管理,支援各種日誌來源和格式,並提供實時異常警報,有助於滿足ISO 27001合規性要求,提高安全性和效率。
Thumbnail
在現代分散式微服務系統中,瞭解EDR、RCA、日誌管理、端點保護和根本原因分析的關鍵性。EDR 可即時監控端點威脅,強化資安。RCA 剖析系統問題根源,促使持續改進。digiLogs提供日誌解決方案,集成EDR和RCA,自動化問題追蹤和解析。了解如何提升企業IT效能和資安,讓您的系統運作更順暢。
Thumbnail
在現代分散式微服務系統中,瞭解EDR、RCA、日誌管理、端點保護和根本原因分析的關鍵性。EDR 可即時監控端點威脅,強化資安。RCA 剖析系統問題根源,促使持續改進。digiLogs提供日誌解決方案,集成EDR和RCA,自動化問題追蹤和解析。了解如何提升企業IT效能和資安,讓您的系統運作更順暢。
Thumbnail
正確地追蹤和監控Web應用中的錯誤對於確保其健康運行和提供高質量的用戶體驗至關重要。
Thumbnail
正確地追蹤和監控Web應用中的錯誤對於確保其健康運行和提供高質量的用戶體驗至關重要。
Thumbnail
什麼是dynatrace? dynatrace在Gartner的分類是屬於APM(應用程式效能監控)的類別。
Thumbnail
什麼是dynatrace? dynatrace在Gartner的分類是屬於APM(應用程式效能監控)的類別。
Thumbnail
你的公司企業有跟上數位轉型的趨勢了嗎?你知道企業資料要做好3D視覺化,可以有更佳的數據整合嗎?專業的智慧戰情室給你最佳的數據整合資訊,讓你可以透過相關的解決方案,為您的企業更增添一份實力!
Thumbnail
你的公司企業有跟上數位轉型的趨勢了嗎?你知道企業資料要做好3D視覺化,可以有更佳的數據整合嗎?專業的智慧戰情室給你最佳的數據整合資訊,讓你可以透過相關的解決方案,為您的企業更增添一份實力!
Thumbnail
家用安全雲端系統 AMAZON-RANGER security management 結合保全系統及智能雲端管理,讓家中24時安全及科技舒適生活 。 保全設定 安全科技保全系統讓家庭提更安全舒適。雲端設備可將盜警訊號簡訊通知直接傳到手機, 影像監視 遠端遙控智能排插 綠能系列 智慧微電網管理系統
Thumbnail
家用安全雲端系統 AMAZON-RANGER security management 結合保全系統及智能雲端管理,讓家中24時安全及科技舒適生活 。 保全設定 安全科技保全系統讓家庭提更安全舒適。雲端設備可將盜警訊號簡訊通知直接傳到手機, 影像監視 遠端遙控智能排插 綠能系列 智慧微電網管理系統
Thumbnail
坊間許多介紹CRWD的文章和影片中,都提到「機器學習」的重要性,是技術關鍵,很多時候更被形容到好像全憑機器學習來防衛一樣。我不是網絡安全專家,但其實只要到CRWD網站讀幾份白皮書,就知道完全不是這一回事。如果不搞清楚這一點,也將無法理解CRWD收購日誌管理公司Humio的真正企圖及未來發展藍圖所在。
Thumbnail
坊間許多介紹CRWD的文章和影片中,都提到「機器學習」的重要性,是技術關鍵,很多時候更被形容到好像全憑機器學習來防衛一樣。我不是網絡安全專家,但其實只要到CRWD網站讀幾份白皮書,就知道完全不是這一回事。如果不搞清楚這一點,也將無法理解CRWD收購日誌管理公司Humio的真正企圖及未來發展藍圖所在。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News