📘《AI 時代系列(6):進階通訊工程——邁向 2035 年太空星鏈網路時代》
📘 第 2 周 📡香農的宇宙:資訊從何而來、能傳多快?
從香農到 AI Channel Model 的完整架構
17/150 單元:率失真理論 📉 壓縮與品質的權衡
________________________________________
🎯 單元導讀
當你向通道傳輸「類比訊號」——例如:
• 影像(Starlink, YouTube)
• 語音(VoIP, 衛星電話)
• 影像感測器(LEO Earth Observation)
• AI feature map(AI-native Network)
• IoT 資料(低頻率但要壓到很小)
你不可能「毫無損失地」把資料壓到任意小。
壓太小 → 品質壞
壓太大 → 流量爆炸
要達成最省頻寬、最少失真,香農給出了一條不可突破的宇宙規律:
⭐ Rate–Distortion Function
R(D)
告訴你:
❗ 在容許失真 D 的情況下,你至少需要多少壓縮率(rate)
❗ 若傳輸率低於 R(D),不可能達到該品質
這就像壓縮領域的「香農容量」。
________________________________________
🧠 一、什麼是 Rate–Distortion?(直覺版)
能容許多少品質下降(D)?要付出多少 bit 流量(R)?
例如:
• 壓縮一張照片壓太小 → 模糊
• 壓縮語音太小 → 機械聲、破音
• 壓縮 AI 特徵圖太小 → 次優、幻覺
率失真理論給我們:
⭐最佳可能的壓縮曲線(任何演算法都不能超越)
就像通道有香農極限,
壓縮也有 rate–distortion 極限。
________________________________________
🧠 二、Rate–Distortion Function:R(D)
公式(一般形式):
⭐ R(D) = min I(X;Ŷ)
「在允許最多 D 的失真下,要用多少 bit 才能把訊號最有效地編碼?」
其中:
• X:原始訊號
• Ŷ:壓縮後重建的訊號
• D:失真限制
• I(X;Ŷ):X 與 Ŷ 的互資訊(可以被「傳達」的資訊量)
含義:
若要重建品質不超過失真 D,至少需要 R(D) bit per symbol。
即使全世界最強:
• VAE
• Diffusion Codec
• H.266
• AI Codec
• 神經網路補償器
• 星鏈特製壓縮
都無法低於 R(D)。
________________________________________
🧠 三、Rate–Distortion Curve(宇宙曲線)
R
|\
| \
| \______________
| \ ← 高失真 → 需要較低率
| \
+--------------------------------> D
↑
低失真 = 高 R
Rate–Distortion 曲線描述「失真 D」與「所需編碼率 R」之間的根本物理關係。曲線左邊代表 要求高品質、失真小,因此必須保留大量資訊,所需的 R 很高;往右移動表示 允許更多失真,重建品質要求降低,因此可以用更少的 bit 表示,R 會快速下降。最終在高失真區,訊號精度已不重要,曲線趨近一個最低率。簡單說:品質要好就必須多花 bit;接受模糊就能節省 bit。這條曲線就是所有壓縮技術無法突破的「宇宙極限」。
解讀:
• 要高品質(小 D)→ 需要用很多 bit(高 R)
• 品質爛沒關係(大 D)→ 可用很少 bit
• 這條曲線不能突破(任何方法都不行)
________________________________________
🧠 四、經典例子:高斯訊號 + MSE 失真
對於一個服從 X ~ N(0, σ²) 的高斯訊號,並以 MSE(均方誤差) 作為失真度量,
Rate–Distortion 的最小可達編碼率為:
R(D) = 1/2 · log₂( σ² / D )
這個公式的含義是:
要把變異數 σ² 的高斯訊號壓縮,並讓重建的失真不超過 D,
至少需要 1/2 · log₂(σ² / D) 個 bit 的平均編碼率。
當 D 越小(要求高品質),分母變小,因此 R 會快速增加;
當 D 越大(允許更多模糊),所需 R 就會下降。
這條公式是所有影像與語音壓縮技術的理論極限。
________________________________________
🧠 五、率失真在 AI × 通訊的六大應用
① Starlink / LEO 衛星影像壓縮
需要把地球表面照片壓到超小而仍能重建細節。
② 雲端遊戲 / XR
壓縮率與畫質間的物理極限。
③ VoIP / 衛星電話
語音壓縮對延遲與品質的最佳折衷。
④ AI Codec(例如 Google Lyra、Meta EnCodec)
AI 壓縮語音或音樂 → 本質就是 Rate–Distortion 優化。
⑤ Edge AI / Feature Compression
AI-native Network 中,R(D) 是壓縮 ResNet 中間特徵的最小 bit 需求。
⑥ IoT / 低功率系統
有限 bit 只能支撐一定精度的量測。
這些都直接靠 Rate–Distortion 理論支撐。
________________________________________
🧠 六、Rate–Distortion 與 Channel Capacity 的關係
這是資訊理論最神聖的連結:
⭐ Source Coding Theorem(壓縮極限)
⭐ Channel Coding Theorem(通道極限)
結合起來變成:
⭐ 若要可靠傳輸,必須滿足:
R(D) ≤ C(SNR)
也就是:
壓縮後的資料率不能超過通道容量。
否則 → 沒救、再強編碼也不夠(回到香農極限)。
這一條就是:
🚀「訊源–通道匹配(Source–Channel Matching)」
所有現代 codec × 5G × AI Codec × Starlink 都是依這條做。
________________________________________
🧠 七、ASCII 圖:Rate vs Distortion(壓縮宇宙必看的圖)
高 R(高 bit) → 低失真(高品質)
低 R(小 bit) → 高失真(低品質)
Quality ↑
|\
| \
| \
| \
| \
+-------------> R (bit / symbol)
↑
壓縮越狠,品質越差
Rate–Distortion 圖揭示了所有壓縮系統無法逃脫的物理限制:**想要高品質,就必須付出高編碼率 R;若壓得越狠、bit 越少,失真必然上升、品質會下降。**因此曲線左側代表高 R、低失真,右側則是低 R、高失真。這條曲線就是影像、語音與任意資料壓縮的「宇宙邊界」,所有 codec 都只能逼近,無法超越。
________________________________________
🧠 八、模擬題
1️⃣ 專業題
請說明 Rate–Distortion Function R(D) 的物理意義。
📜 答案:
R(D) 表示在容許最大失真 D 的條件下,能達到該品質所需要的最小壓縮率。
任何壓縮技術都不可能低於 R(D),否則重建品質必然無法達到。
________________________________________
2️⃣ 應用題
若 Starlink 的地表影像壓縮允許較大 D,則所需 bit 量:
A. 增加
B. 減少
C. 和 D 無關
D. 取決於天氣
📡 答案:B
容許較大失真 → 可以用更低率。
________________________________________
3️⃣ 情境題
若 AI Codec 的壓縮率已經接近率失真極限,但仍想提高畫質,應該?
A. 換更強的神經網路
B. 增加 codebook
C. 增加 R(每秒 bit 數)
D. 減少 decoder 通道數
📶 答案:C
因為若已逼近 R(D),品質提升只能靠增加 bit。
________________________________________
🛠 九、實務演練題
1️⃣ 對高斯訊號模擬 MSE 失真下的 R(D) 曲線
2️⃣ 編碼影像,測量 PSNR vs bit rate(實測 rate–distortion)
3️⃣ 比較 JPEG / H.264 / H.266 / VAE / EnCodec 與理論極限的差距
4️⃣ 模擬 Starlink 在 Ka 頻段下的影像壓縮需求
5️⃣ 在低頻 IoT 系統測試 R(D) 與 C(SNR) 匹配
________________________________________
✅ 十、小結與啓示
✔ Rate–Distortion 理論決定壓縮的物理極限
✔ D 越小 → 需要越高 R
✔ D 越大 → R 趨近 0
✔ R(D) 就像「壓縮界的香農容量」
✔ AI Codec、影像壓縮、語音壓縮全靠它
✔ 傳輸必須滿足 R(D) ≤ C(SNR) 才能可靠
✔ 星鏈 / LEO / XR / IoT 都高度依賴這理論
一句話:
⭐ 壓縮不是憑感覺,而是有宇宙定律的。
⭐ Rate–Distortion 就是壓縮世界的「香農極限」。














