📘 AI時代系列(4):AI 驅動的電信網路規劃與設計 🌐
42/100 第五週:📌 網路管理與監控
42. NMS 與 OSS 功能 📊 —— 電信運維的核心中樞
________________________________________
🎯 單元導讀
在電信網路的日常運維中,系統規模龐大,跨越 接入、傳輸、核心、雲平台 等多層級,需要強大的管理系統支撐。
其中:
• NMS(Network Management System) 側重於 單一網路或設備層級 的監控與管理。
• OSS(Operation Support System) 是更高層級,涵蓋 業務、服務、資源的整體運維支撐,並與 BSS(Business Support System)緊密結合。
👉 可以把 NMS 視為「望遠鏡」專注設備,OSS 則是「指揮中心」統籌全局。
________________________________________
🧠 一、NMS(網路管理系統)功能
1. 設備監控:即時監測交換器、路由器、光傳輸設備、gNB 狀態。
2. 告警處理:透過 SNMP Trap / Syslog 收集異常資訊,顯示拓撲警示。
3. 效能監控:CPU、記憶體、介面流量、錯誤率。
4. 組態管理:版本控制、韌體升級、自動化配置。
5. 故障排查:整合 Ping、Traceroute、Log 分析。
案例:中華電信骨幹光纖出現高 BER(Bit Error Rate),NMS 即時告警,觸發工程師排查光放大器。
________________________________________
🧠 二、OSS(營運支援系統)功能
OSS 比 NMS 更高層,整合了 FCAPS 管理 與 服務編排,是電信營運的核心中樞。
1. 資源管理:追蹤基站、傳輸路由、核心網 CNF 等資源。
2. 服務編排:新服務(如 5G 切片、企業專網)的自動配置。
3. 故障與效能整合:從設備層(NMS)收集數據,轉為 SLA 分析。
4. 跨域整合:連結 RAN、Transport、Core、Cloud 多層架構。
5. 與 BSS 結合:將網路 SLA 與計費、客服系統串聯。
案例:企業租用 5G 專線,OSS 自動編排專線,並監控 SLA(延遲 <20ms),若違約自動回報 BSS 觸發補償。
________________________________________
🔁 三、ASCII 架構示意
┌───────────────────────┐
│ BSS (業務支援) │ ← 客服、計費、CRM
└─────────┬─────────────┘
│
┌─────────▼─────────────┐
│ OSS (營運支援) │ ← 資源、服務、故障、性能管理
└─────────┬─────────────┘
│
┌─────────▼─────────────┐
│ NMS (網路管理) │ ← 設備層監控、告警、流量分析
└─────────┬─────────────┘
│
┌─────────▼─────────────┐
│ NE (網路設備) │ ← Router, Switch, gNB, OLT
└────────────────────────┘
這個 ASCII 架構圖完整地呈現了電信與 IT 網管系統的層級化設計,從頂層的業務支援到最底層的實體設備,逐層分工明確:
• BSS(Business Support System, 業務支援系統) 位於最上層,主要與客戶和營收直接相關,包括客服中心、計費系統以及 CRM(客戶關係管理)。它是企業對外的門面,確保用戶能順利申辦服務、查詢帳單與解決問題。
• OSS(Operation Support System, 營運支援系統) 居於中間,承接 BSS 的業務需求,負責將其轉化為對網路資源的操作與管理。OSS 涵蓋服務開通、資源配置、故障管理、性能監控等,確保網路能持續穩定運行。
• NMS(Network Management System, 網路管理系統) 更靠近基礎設備,專注於設備層級的監控與維護。它能即時偵測設備狀態、產生告警、監測流量,並提供運維人員數據分析工具,快速排除異常。
• NE(Network Element, 網路設備) 是最底層的實體與虛擬設備,包括 Router、Switch、基地台(gNB)、光纖接取設備(OLT)等,真正承載數據傳輸與服務。
👉 從上到下是一個完整的鏈條:BSS 管理商業與用戶需求 → OSS 落實資源與營運 → NMS 執行設備監控 → NE 實際提供網路服務。這種分層設計不但清楚劃分責任,也讓電信網路能同時兼顧業務靈活性與技術穩定性。
________________________________________
🧪 四、應用場景
1. NMS
o 例:監控高雄地區 5G gNB 狀態,若某基站掉電,NMS 即時報警。
2. OSS
o 例:當基站掉電,OSS 不僅接收告警,還會分析對 SLA 影響,並在客服端顯示影響用戶數。
3. NMS + OSS + AI
o 透過 AI,OSS 可自動化故障預測與資源調度,例如預測某傳輸路由壅塞,自動 reroute 流量。
________________________________________
⚙️ 五、AI 與自動化的結合
• NMS + AI:自動化告警過濾,避免「告警風暴」。
• OSS + AI:智慧 SLA 監控、資源最佳化、異常模式學習。
• Closed-Loop Automation:AI 在 OSS 觸發自動修復,例如自動重新部署 CNF。
________________________________________
💼 六、實務題
1. 基礎題
o 問題:NMS 與 OSS 的主要差異是什麼?
o 答案:NMS 側重於設備層監控,OSS 是整體營運支撐,包括資源、服務與 SLA。
2. 應用題
o 問題:如何利用 OSS 提升 5G 專網的運維效率?
o 答案:透過 OSS 自動編排專網切片,並持續監控 SLA,當性能下降時自動調度資源。
3. 設計題
o 問題:如果要設計一個跨區域 OSS 平台,如何整合不同廠商的 NMS?
o 答案:透過標準介面(如 TMF API、REST、NETCONF)整合多個 NMS,統一至 OSS 平台。
4. 診斷題
o 問題:如果 NMS 發生大量告警,你會如何在 OSS 層處理?
o 答案:利用 AI 告警壓縮與關聯分析(Correlation),將相同事件整合,避免告警風暴。
5. 進階題
o 問題:在雲原生 5G 核心網環境,OSS 如何與 Kubernetes 整合?
o 答案:OSS 透過 API 調用 K8s 資源,實現 CNF 的自動部署、彈性伸縮與監控。
________________________________________
✅ 七、小結與啟示
• NMS:設備層監控,偏「技術細節」。
• OSS:營運支撐系統,偏「服務與資源」。
• BSS:面向用戶的客服、計費系統。
• AI 與雲原生:讓 NMS + OSS 融合更智慧化,支援 5G/6G 超大規模網路。
👉 可以把 NMS 視為「醫生的聽診器」,OSS 則是「醫院管理系統」,兩者缺一不可。











