簡介
隨著高效能運算需求的增長,PCI Express (PCIe) 介面不僅在傳輸速度上不斷演進,其電源管理能力也日益重要。本文將根據未來記憶體儲存聯盟 (Future Memory and Storage) 發布的技術文件 [1],深入探討兩項關鍵的電源管理技術:PCIe 5.0 的 Power Excursion (功率突波) 與 PCIe 6.0 的 L0p (低功耗狀態)。這些技術旨在應對高階顯示卡 (GPU) 和加速器等裝置在瞬間產生的高功率需求,同時在不同工作負載下優化能源效率。
Power Excursion (功率突波)
Power Excursion 是一種允許 PCIe 擴充卡在極短時間內,其功率消耗暫時超過規格所定義的最大持續功率 (Maximum Sustained Power) 的機制。此功能對於不需要額外輔助電源接頭(如新型 12V-2x6 或 48HPWR)的擴充卡至關重要,特別是在處理需要瞬間大量運算資源的任務時,例如 AI 推理或圖形渲染,此時會產生功率尖峰。
此機制的啟用受到嚴格控制,必須在主機系統發送 `Set_Slot_Power_Limit` 訊息後才能觸發。系統與擴充卡都必須遵循電源供應軌道 (Power Supply Rail) 的相關要求,以確保系統的穩定性與安全。功率突波的規範與計算
Power Excursion 的核心規範定義了在特定時間區間 (T) 內,平均功率與最大持續功率的比值 (R) 的上限。此比值根據不同的電源軌道與時間長度而有不同的計算公式,詳細規則整理如下表:

從上表可知,允許的功率超額量會隨著時間區間的拉長而下降,最終回歸到最大持續功率的標準 (R=1),以防止長時間的過載運作。
L0p (低功耗狀態)
L0p 是 PCIe 6.0 引入的一種低功耗子狀態,旨在不中斷資料傳輸的前提下,透過動態調整頻寬來降低功耗。當裝置處於 L0p 狀態時,它可以減少正在使用的 PCIe 通道 (Lane) 數量,從而節省能源。這項功能是選擇性的,並且專為 Flit Mode 設計,因為傳統的 L0s 狀態在 Flit Mode 下不被支援。
L0p 的運作由主機 (Host) 與裝置 (Device) 之間的交握協議來完成。任一方都可以發起進入或退出 L0p 狀態的請求,另一方則以確認 (ACK) 或否認 (NAK) 回應。此過程非常高效,不需要像傳統的鏈路狀態轉換那樣進行完整的鏈路重新訓練 (Link Retraining)。
Power Excursion 測試
測試重點在於精確捕捉功率、電流和電壓的變化。分析顯示,裝置在啟動初期的湧入電流 (In-rush Current) 雖然不受 Power Excursion 規範,但仍需符合標準的 CEM 電源軌道限制。測試中也發現,若裝置在收到 `Set_Slot_Power_Limit` 訊息前產生過大的湧入電流,或長時間維持高功率消耗,將會違反規範,可能導致系統不穩。
L0p 效能與功耗節省
L0p 的測試旨在評估其在不同工作負載下的節能效益。測試平台涵蓋了 Gen3 至 Gen5 的不同組合,並比較了啟用與未啟用 L0p 時的效能與功耗差異。結果顯示,L0p 主要在有資料流量時才能發揮其節能優勢,對於閒置狀態的功耗影響較小。
以下表格整理了在 Gen5 E3 主機上進行的測試數據,展示了不同通道配置下的能源效率表現:

數據顯示,在某些特定工作負載下(如 4k 隨機讀取) ,使用較少通道 (x2) 的能源效率顯著高於使用較多通道 (x4)。然而,在多數情況下,較高的頻寬 (x4) 帶來了更高的整體效率。這表明,最佳通道配置取決於具體的工作負載特性,需要在效能與功耗之間做出權衡。
結論
Power Excursion 與 L0p 是 PCIe 標準中應對現代高效能運算挑戰的重要創新。Power Excursion 為高階擴充卡提供了應對瞬間功率需求的彈性,但必須在嚴格的規範下運作以確保系統穩定。L0p 則提供了在維持資料傳輸的同時動態調整功耗的能力,有助於提升整體能源效率。
對於系統設計者與開發者而言,深入理解並善用這些功能,將是開發下一代高效能、低功耗運算平台的關鍵。未來的挑戰在於如何根據不同的應用場景與工作負載,智慧地調度這些電源管理功能,以在效能與節能之間取得最佳平衡。
















