Let's learn data governance.
這是一個從公司角度探討如何有效實施資料治理,以及會遭遇哪些困難挑戰的題目。 經過一番研究,我發現這個問題既複雜又有趣。但比起直接給答案,我更想分享:如何以「架構師思維」去學習一個陌生的領域,進而順利完成研究工作?
我認為,學習一個問題最好的方式,永遠是從定義開始,接著分析問題,最後才推導出解決方案。
一、 核心定義:什麼是治理(Governance)與管理(Management)?
要拆解複雜問題,必須先回到「第一原理」,釐清最基礎的定義。治理跟管理的差別是什麼?簡言之:
- 治理(Governance)是「做正確的事(Do the right thing)」:其核心在於建立規則、擬定策略與合規監督。 它負責定義問題的「邊界(Boundary)」。
- 管理(Management)是「把事做正確(Do the thing right)」:其核心在於實際操作、資源分配與流程效率。 它負責確認邊界內的「內容(Content)」。

Do the right things right. By Warren.

Summary of Governance and Management.
總之,治理談的是上層的抽象概念與邏輯框架;管理則是任務執行與細節效率。 兩者有如「戰略」與「戰術」,具備先後互補關係。 當缺乏治理架構時,就算管理端的執行力再高,也沒有意義。 只有釐清這層定義,我們才能進一步探討資料應用層面的議題。
二、 第一原理應用:充分瞭解資料治理(Data Governance)的重要性
為什麼資料需要被治理? 在測試專案中,同事曾提到彙整測試資料非常耗時,因為每次報告的格式都不一,加上產品版本不斷更新,追查問題往往要花上 1-2 天。這就是資料缺乏治理與管理,導致業務分析效率低下的經典案例。
從公司層面來看,研發、生產、品質、製造每天都會產出海量數據。 這些資料若無法有效利用,僅是儲存就是極大成本。 資料已經是資產的一部分,投資資料治理就像投資生產設備一樣,能提升營運效率並降低使用風險。
成功資料治理的五大要素
- Quality(品質):確保資料正確且一致。例如客戶碼定義要統一與對應邏輯
- Completeness(完整性):具備足夠的資料維度。就像產線管理需要「人機料法環」
- Privacy(隱私):落實分級與權限控管與滿足資安要求
- Clear Systems(透明系統):從文管系統建立治理標準與作業流程(SOP)。
- Legal Compliance(合規):資料應用必須滿足國際規範與法律要求
三、 執行面思考:資料管理(Data Management)的實施關鍵
資料管理是基於治理框架下的維運,目標是讓系統滿足商業需求。 我們可以從三個層面切入:
- Business(業務層面):識別應用目的、資料來源、所有權與存取規定。 有效來源包含資料庫(Database)、資料湖(Data Lakes)與資料倉庫(Data Warehouses)。
- Data Engineering(工程層面):IT 團隊根據品質與安全要求進行數據蒐集與監控,處理異常事件並管理權限。
- Usage(應用層面):定期稽核(Regular Audits),檢視活動日誌以確保資料被合法合規地使用,並持續改善。
總結
面對陌生且龐大的「資料治理」題目,架構師的思維模式並非直接跳入技術細節,而是先透過「定義邊界(治理)」與「確認內容(管理)」建立起底層邏輯。當我們理解了資料作為資產的本質,並掌握了品質、完整性、隱私等五大要素後,原本模糊的題目就會變得清晰可操作。
這套從「第一原理」出發的研究方法,不僅適用於資料治理,更能助你征服任何複雜難題。在下一篇中,我們將深入探討企業在實施這套框架時,會遇到哪些具體的困難挑戰。










