前言
在現代雲端運算環境中,虛擬機器(VM)的無縫遷移對於確保服務連續性、硬體維護和資源優化至關重要。
然而,如何在不影響使用者體驗的前提下,實現高效能、低延遲的即時遷移(Live Migration),一直是超大型資料中心(Hyperscaler)面臨的重大挑戰。本文將深入解析 Microsoft 所提出的 Windows Live Migration 技術,特別著重於與 NVMe SSD 相關的最新標準化進展,說明如何建立一致、可預測且高效能的 VM 儲存體驗。
主要內容根據 Future of Memory and Storage (FMS) 大會中,Microsoft 雲端硬體儲存總監 Lee Prewitt 的技術演講整理而成。
核心挑戰:VM Guest 體驗的一致性
從超大規模資料中心的角度來看,核心挑戰在於提供一致、可預測且高效能的 VM Guest 體驗。
這代表任何底層的基礎設施操作(尤其是 Live Migration),都必須對上層的 Guest VM 完全透明。
過去,為了實現此目標,雲端服務商常採用高度客製化的專有邏輯,隱藏底層硬體變更。
但這種方式增加了複雜性,也限制了硬體選擇彈性。
因此,自 2023 年起,Microsoft、Samsung、Google 等業界領導者積極推動 NVMe 與 OCP(Open Compute Project)標準化,以解決這些痛點。
+-------------------+
| VM |
| +---------------+
| | Guest Kernel |
| | +-------------+
| | | PCI NVMe Dr.|
| | +-------------+
| +---------------+
+-------+-----------+
| (I/O Path)
+-------+-----------+
| Hypervisor |
+-------------------+
| Host Kernel NVMe Dr.|
+-------------------+
| (PCIe)
+-------+-----------+
| NVMe SSD |
+-------------------+
Live migration should not be observable by the guest VM.
它必須高效、隔離,且硬體更新不可被 VM 感知。
為何需要 Live Migration?
Live Migration 的目的,是在不中斷客戶工作負載的情況下,維持服務可用性。
根據 Microsoft 的統計,客戶對服務中斷的容忍度極低,因此必須將年度中斷率(Annual Interruption Rate, AIR)降至最低。
下表整理了其主要應用場景:

現有技術的瓶頸:半虛擬化的不足
雖然半虛擬化(Para-virtualization)技術行之有年,但面對高速 NVMe SSD,其瓶頸日益明顯:
- 效能損耗:多層轉譯導致 NVMe SSD 無法發揮完整 IOPS。
- 成本高昂:需消耗主機 CPU 處理 I/O 模擬,降低客戶可用核心數。
- 延遲增加:I/O 請求經 Hypervisor 轉譯後,延遲明顯上升。
解決方案:將 Hypervisor 移出 I/O 路徑
為解決上述問題,Microsoft 推動了兩項關鍵技術提案(Technical Proposal, TP):
🔹 TP4165:追蹤 LBA 分配(Tracking LBA Allocation)
僅複製正在使用的邏輯區塊位址(LBA),減少遷移資料量,縮短時間並降低頻寬需求。
🔹 TP4159:PCIe Live Migration 基礎設施
提供完整 PCIe 支援架構,包含:
- Namespace Migration:只追蹤已變更 LBA,最小化資料複製量。
- Controller Migration:遷移控制器狀態(佇列、設定等),確保一致性。
- QoS 控制:在遷移過程中動態限制 VM I/O 速率,避免影響其他 VM。
未來挑戰與展望
儘管 TP4165 與 TP4159 奠定了重要基礎,但仍有關鍵課題待解:
- 降低 Hypervisor 介入:
擺脫對 Admin Queue 的攔截,尤其在 Confidential Computing(機密運算)場景中,能最小化攻擊面。 - 一致性抽象:
透過 PCIe® Exported NVM Subsystem 的設計,對控制器、命名空間、日誌頁面(Get Log Page)進行抽象化,使 VM 對硬體變化「無感」。 - 未來標準化方向:
- 資源分配標準化:讓不同 PCIe 功能(PF、SR-IOV、SIOV)間能靈活附掛資源。
- 支援 TDISP for NVMe:定義 DEVICE_INTERFACE_REPORT,提供機密運算的標準化介面。
結論
Windows Live Migration 的演進展示了業界對 「高效能 + 安全性 + 標準化」 的追求。
透過將 Hypervisor 從 I/O 路徑中移除、並建立標準化遷移基礎設施,未來雲端平台將能在不犧牲效能的前提下,達成更靈活的資源管理與更穩定的雲端體驗。
系統架構概觀
在典型的虛擬化環境中,儲存 I/O 路徑如下圖所示。
Live Migration 的挑戰,在於如何在 VM 從一台實體主機遷移到另一台時,仍維持 I/O 的連續性與效能。















