DevOps Taiwan Meetup#65 RECAP：可觀測性 Observability

2024/12/21 更新2024/12/21 發佈閱讀 6 分鐘

這週五，我參加了人生中的第一次 DevOps Taiwan Meetup，沒想到初次體驗就撞上了最熱門的話題——可觀測性（Observability）。活動現場的熱烈程度超乎想像，甚至連走道都被坐滿了！只需要 50 元場地費，就能享受兩小時滿滿的知識密集的分享，真的讓人驚喜不已。周圍的參與者也都很厲害，以後會常常參加!希望未來也能夠有能力站上講台分享心得！

這次的主講人是 Blueswen 和雷N，他們帶來了許多關於 Observability 的核心要點，並展示了如何通過 Live Demo 在開發部署階段「將問題左移」，提升問題解決效率。有過 Dynatrace 經驗的我，發現很多內容與過去的實務經歷相呼應，可以舉一反三。以下是我的筆記與重點整理。

為什麼需要可觀測性？和監控有什麼差別?

監控（Monitoring） 是一種針對特定指標進行數據收集、分析和使用的過程，主要用來追蹤系統運行狀況，幫助及時發現異常並輔助決策。然而，它的數據通常與更廣泛的系統背景脫節。

而 可觀測性（Observability） 是指通過分析系統生成的數據（如日誌、指標和分散式追踪），來深入理解系統內部狀態的能力。它不僅能快速檢測問題，還能幫助找出問題的根本原因，特別適用於現今微服務架構下的複雜系統。

其關鍵差異，舉例來說:

1. 問題處理方式

- 監控：「我知道可能會出問題，所以我要監控這些指標。」通過預先設置的指標進行異常檢測，例如 CPU 或記憶體使用率的警報通知。
- 可觀測性：「我不確定會出什麼問題，但我需要足夠的信息來理解問題。」通過全面的數據收集，幫助分析問題的性質與根源。

2. 數據深度

- 監控：關注表層數據和預定義指標。例如 CPU 使用率、記憶體使用率等監控指標。
- 可觀測性：深入系統內部，一個 request 進來後從 end to end 完整的上下文信息。包括日誌、分布式跟踪和多層的指標(最基本的就是 log, metric, trace)，反映系統內部運行(程式互相呼叫)的細節。

3. 問題診斷

- 監控：告訴你「出了什麼問題」。比如警報通知 CPU 達到臨界值，但無法告知問題的根本原因。
- 可觀測性：幫助你理解「為什麼出問題」以及「如何解決」。

Observability 誕生原因

當系統出現異常時，我們是否有足夠的資訊來了解發生了什麼事？這些資訊是否被妥善保存？是否有效地被利用？還是散落在各處形成了資料孤島(Data Silo)，是不是能夠有效的將不同來源的資料一起顯示並關聯再一起，讓你在查找問題時能夠看到問題和根本原因的關聯性？

可觀測性(Observability)就是為了解決這些問題而生的概念，它強調透過各種資訊來清楚了解系統狀態。

可觀測性的三大支柱

可觀測性主要包含但是不限於這三種最核心的資料種類：

指標(Metrics)：
- 不同時間採樣的系統量化指標
日誌(Logs)：
- 記錄系統中發生的具體事件
分散式追蹤(Distributed Tracing)：
- 記錄請求在不同服務中的完整歷程

來自簡報截圖

建置 Observability 資料流程的四個階段

可觀測性的實作可以分為四個主要階段：

生成：由各種來源產生觀測資料
收集：將資料從各處收集起來
儲存：將收集到的資料妥善保存
使用：透過各種工具分析和呈現資料

來自簡報截圖

建置 Observability 的一些考量

資料流向的規劃 (pull/push)
收集哪些資料 / 儲存在哪裡 / 儲存多長的資料 / 是否要使用 collector 去篩選資料
- 影響成本
工具的選擇 (通用 / 不被 vendor lock)
儲存空間的如何管理
何時該導入?
- 一開始，且各環境都可以有，但規模和收集資料頻率的不同(成本考量)
是否影響到環境的效能，本末倒置。
- 有提到了 OpenAI 2023/11/11 的事件，其中大量的 Telemetry Service API 請求反而導致 K8s Control plane 過載

我的 TAKEAWAY

針對效率損失很有共鳴，原本很專心做一件事情，被各種環境問題或是雜事中斷真的很有感，處理完了，時間也差不多下班了、腦力也差不多歸零了
在一線大廠和二線的 MTTR 差了 2.4 倍，而解問題其實大部分的時間都是用在找出根本原因(通靈)的部分，可以看到好的可觀測性帶來多少時間的效益

自自簡報截圖

工具很多，選擇最適合自己的最重要
導入越早越好，如有成本可量，可篩選要收集哪一些資料
用商業軟體真的很好用哈哈哈，像是 datadog / dynatrace 等等，工具選擇、工具的維護升級、儲存的煩惱都幫你做好了，甚至商業軟體的 agent 安裝好後，服務重啟 trace 的監控碼也都插入好了，前端後端的關聯性也整合好了!!(這邊有人 QA，講師回答可以做但是很多功夫要做)

講師的簡報資源

DevOps Taiwan Meetup 資訊

DevOps Taiwan Community | DevOps 台灣社群

DevOps Taiwan Community - KKTIX

DevOps Taiwan | Facebook

補充資料

留言

Marcos的方格子

25會員

52內容數

歡迎來到「Marcos的方格子」！目前在「Marcos談科技」撰寫在職涯上學習到的知識，在「Marcos談書」分享我在日常的閱讀和心得，歡迎您的到來!!

Marcos的方格子的其他內容

2024/12/14

2024 CKA 題幹解答紀錄

本篇文章針對 CKA 認證考試中常見的實作題目，提供詳細解題流程與指令範例。內容基於 examtopic 題目解析，幫助考生掌握實作技能與應試技巧，快速提升 Kubernetes 操作能力，為通過 CKA 考試做好萬全準備！

2024/12/14

2024 CKA 題幹解答紀錄

2024/09/17

我如何一年內考取 Google Cloud 所有雲端證照｜Google Cloud

如何一年內考取 Google Cloud 所有雲端證照

2024/09/17

我如何一年內考取 Google Cloud 所有雲端證照｜Google Cloud

如何一年內考取 Google Cloud 所有雲端證照

2024/09/16

Professional Data Engineer 考試/心得整理｜Google Cloud

2024/09/16

Professional Data Engineer 考試/心得整理｜Google Cloud

看更多

你可能也想看

k.S的量化投資

【深度解讀】打破百萬門檻迷思：小資族如何透過「債券孳息」打造優於定存的美元現金流？

債券投資，不只是高資產族群的遊戲在傳統的投資觀念中，海外債券（Overseas Bonds）常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻，讓許多想尋求穩定配息的小資族望而卻步。然而，在股市波動劇烈的環境下，尋求穩定的美元現金流與被動收入成為許多投資人

#玉山證券#海外債券#債券孳息

2026/02/06

k.S的量化投資

【深度解讀】打破百萬門檻迷思：小資族如何透過「債券孳息」打造優於定存的美元現金流？

#玉山證券#海外債券#債券孳息

2026/02/06

Jorge2006的沙龍

玉山證券小額債—川普又來報明牌啦!

透過川普的近期債券交易揭露，探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響，以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺，如何讓小資族也能低門檻參與海外債券市場，實現「低門檻、低波動、固定收益」的務實投資方式。

2026/03/13

2026/03/13

拒絕梭哈投資，建立財務餘裕｜玉山證券小額債為你打造資產穩定錨

解析「債券」如何成為資產配置中的穩定錨，提供低風險高回報的投資選項。藉由玉山證券的低門檻債券服務，投資者可輕鬆入手，平衡風險並穩定財務。

#投資#資產配置#債券投資

2026/03/13

CK On Board

拒絕梭哈投資，建立財務餘裕｜玉山證券小額債為你打造資產穩定錨

#投資#資產配置#債券投資

2026/03/13

小芝女看天下

任何人都能投資！用玉山證券小額債替自己存旅費：1,000 美元就能開始的穩健理財法

相較於波動較大的股票，債券能提供固定現金流，而玉山證券推出的小額債，更以1000 美元的低門檻，讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色，大幅降低投資難度，對於希望分散風險、建立穩定現金流的人來說，玉山小額債是一個值得嘗試的理財起點。

#玉山小額債#小額債#玉山證券

2026/02/12

小芝女看天下

任何人都能投資！用玉山證券小額債替自己存旅費：1,000 美元就能開始的穩健理財法

#玉山小額債#小額債#玉山證券

2026/02/12

李惠銘AMG的沙龍

校園加強安檢的「戴明觀點」

戴明強調系統運作一定會有異常，而解決問題的關鍵在於正確判明原因並提出對策。改善系統時，不應該只憑經驗，而應該依據知識理論來訂出行動方案。文章探討了事件中的特殊和共同因，並強調要讓系統回到原有的運作狀態。

2024/01/21

2024/01/21

企業如何合規 ISO 27001 Log 日誌管理要求？｜昕力資訊

探索台灣資通安全管理法對企業和政府的影響，以及實施ISO 27001的好處。digiLogs提供一站式的日誌管理，支援各種日誌來源和格式，並提供實時異常警報，有助於滿足ISO 27001合規性要求，提高安全性和效率。

#資訊安全#資安#資訊

2023/12/08

昕力資訊的沙龍

企業如何合規 ISO 27001 Log 日誌管理要求？｜昕力資訊

#資訊安全#資安#資訊

2023/12/08

昕力資訊的沙龍

企業微服務系統日誌混亂？視覺化EDR與RCA技術有解方｜昕力資訊

在現代分散式微服務系統中，瞭解EDR、RCA、日誌管理、端點保護和根本原因分析的關鍵性。EDR 可即時監控端點威脅，強化資安。RCA 剖析系統問題根源，促使持續改進。digiLogs提供日誌解決方案，集成EDR和RCA，自動化問題追蹤和解析。了解如何提升企業IT效能和資安，讓您的系統運作更順暢。

#RCA#log#EDR

2023/11/30

昕力資訊的沙龍

企業微服務系統日誌混亂？視覺化EDR與RCA技術有解方｜昕力資訊

#RCA#log#EDR

2023/11/30

KH Huang的沙龍

Golang - Gin #32: Gin的錯誤追蹤和監控

正確地追蹤和監控Web應用中的錯誤對於確保其健康運行和提供高質量的用戶體驗至關重要。

#Gin#Golang#GolangLab

2023/10/07

KH Huang的沙龍

Golang - Gin #32: Gin的錯誤追蹤和監控

正確地追蹤和監控Web應用中的錯誤對於確保其健康運行和提供高質量的用戶體驗至關重要。

#Gin#Golang#GolangLab

2023/10/07

Marcos的方格子

〔學習筆記〕Dynatrace：Gen3現代化應用程式監控平台簡介

什麼是dynatrace? dynatrace在Gartner的分類是屬於APM(應用程式效能監控)的類別。

#監控#應用程式#Dynatrace

2023/08/23

Marcos的方格子

〔學習筆記〕Dynatrace：Gen3現代化應用程式監控平台簡介

什麼是dynatrace? dynatrace在Gartner的分類是屬於APM(應用程式效能監控)的類別。

#監控#應用程式#Dynatrace

2023/08/23

Lin Yi的沙龍

企業資料3D視覺化，智慧戰情室給你最好的數據整合！

你的公司企業有跟上數位轉型的趨勢了嗎？你知道企業資料要做好3D視覺化，可以有更佳的數據整合嗎？專業的智慧戰情室給你最佳的數據整合資訊，讓你可以透過相關的解決方案，為您的企業更增添一份實力！

#資訊#資訊科技#智慧戰情室

2022/09/06

Lin Yi的沙龍

企業資料3D視覺化，智慧戰情室給你最好的數據整合！

#資訊#資訊科技#智慧戰情室

2022/09/06

翔翔的沙龍

讓皇家遊騎兵向您說明，當保全系統與數位科技結緣，會有哪些安全產品服務呢 ?

家用安全雲端系統 AMAZON-RANGER security management 結合保全系統及智能雲端管理,讓家中24時安全及科技舒適生活。保全設定安全科技保全系統讓家庭提更安全舒適。雲端設備可將盜警訊號簡訊通知直接傳到手機, 影像監視遠端遙控智能排插綠能系列智慧微電網管理系統

#產品#科技#保全

2022/07/22

翔翔的沙龍

讓皇家遊騎兵向您說明，當保全系統與數位科技結緣，會有哪些安全產品服務呢 ?

#產品#科技#保全

2022/07/22

美股投資十日談

【個股追蹤】雲端安全公司Crowdstrike進軍日誌管理市場！CRWD未來的終極發展藍圖

坊間許多介紹CRWD的文章和影片中，都提到「機器學習」的重要性，是技術關鍵，很多時候更被形容到好像全憑機器學習來防衛一樣。我不是網絡安全專家，但其實只要到CRWD網站讀幾份白皮書，就知道完全不是這一回事。如果不搞清楚這一點，也將無法理解CRWD收購日誌管理公司Humio的真正企圖及未來發展藍圖所在。

#個股追蹤#CRWD#美股

2021/03/25

美股投資十日談

【個股追蹤】雲端安全公司Crowdstrike進軍日誌管理市場！CRWD未來的終極發展藍圖

#個股追蹤#CRWD#美股

2021/03/25

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News