當氣象預報也 AI Powered

更新於 2024/03/20發佈於 2024/03/20閱讀時間約 7 分鐘

近期 Sora 重磅推出，各種超實影片散佈社群平台，重現了 2022 年 ChatGPT 推出時的面貌。

這讓大眾以為，2023 年的 AI 革命主旋律，就是圍繞 ChatGPT、Sora，這種 GenAI 類型的革命。

但事實上，和人們日常息息相關的氣象預報，在 2023 年也同樣掀起 AI 革命，直接挑戰了傳統預報模式。

今天，我們就來聊聊，這場 23 年悄悄發展的氣象 AI 革命。

現在的天氣預報，其實都先仰賴一台超級電腦，經過數小時的運算，先算出一個大致數值預報。

氣象局的預報員們得到資料後，經過他們的預報經驗，輔佐其他大氣數據，會再做出修正後、更準確的天氣預報。

其中，修正電腦預報這一步，遠比你想像的還重要。

舉個例子，以台灣為例，氣象員們通常有個 feel，當颱風從東南方準備登陸時，通常會有偏向某條河流、或呈現 z 字偏折的狀況。

這種情況通常數值預報掌握不到，就必須仰賴資深的預報員，進行預報修正。

ECMWF HiRes Model Precipitable Water - MyFoxHurricane.com

數值預報的計算，其實仰賴了過去數百年的知識。工程師們會把氣象物理知識，寫成 code、演算法，供超級電腦計算。

在每日預報時，工程師會餵入地面觀測站的資料、衛星資料等，讓電腦算個幾小時產生結果。

但數值預報上，有幾大難題。

第一是算力。數值預報因為牽扯龐大的運算，超級電腦真的要很超級。

全球前 500 大超級電腦中，台灣中央氣象局就有兩台，同時正耗資數十億，繼續買超級電腦，因應未來預報需求。

第二是資料缺乏，氣象預報的第一步是資料收集。要做成好的預報，不但需要衛星資料、也要地面觀測站資料。

衛星資料一照可以照一大片地球表面，但地面資料再怎麼努力，太平洋這塊也是少一大塊，山區也是。

而全球數值運算的模型，全世界也有幾大派別，其中最大的兩家，是歐洲的 ECMWF、和美國的 GFS 。

ECMWF 和 GFS 誰好誰壞，有點地域性的因素。普遍來說，台灣鄉民比較喜歡 ECMWF ，在夏秋颱風季 ECMWF 也表現比較好。

ECMWF 也因此成為 Benchmark ，每當有一個 AI Model 誕生時，都要和 ECMWF 一較高下，看誰比較厲害。

2023 年底，由 Google Deepmind 發表的 Graphcast 閃亮登場。登場的第一句話是

Our state-of-the-art model delivers 10-day weather predictions at unprecedented accuracy in under one minute.

Deepmind 團隊宣稱，他們透過過去數十年的氣象資料，讓模型通過 data，學習 pattern，一舉揮別傳統 algorithm-based 的數值預報。

要產出 10 天預報，傳統上，我們需要幾百個 CPU、GPU 的超級電腦，運算好幾小時，跑出數值預報。

現在，只需要一個 Google TPU machine ，跑不到一分鐘，就算出全球模式的預報，準確度甚至可能高於傳統算法。

同時，這個模型還有幾大要點：

不像 23 年 GenAI-based model 是 Transformer，Graphcast 是用 Graph Neural Networks (GNNs)，在物理空間上，表現較有優勢的基底模型。
0.25 精度的解析度，約 28km x 28km 的大小。投射地球上，有超過百萬個數格(grids)。
在對流層不同高度上，可以產出溫度、風速、風向、濕度、氣壓等預測。
在極端氣候上，例如颱風路徑預測、熱浪，表現都不亞於傳統算法。

因此，不論是在預報上、甚至是算力上，我們都看見了 AI 肌肉的實力，也為中尺度預報展開新的篇章。