近期 Sora 重磅推出,各種超實影片散佈社群平台,重現了 2022 年 ChatGPT 推出時的面貌。
這讓大眾以為,2023 年的 AI 革命主旋律,就是圍繞 ChatGPT、Sora,這種 GenAI 類型的革命。
但事實上,和人們日常息息相關的氣象預報,在 2023 年也同樣掀起 AI 革命,直接挑戰了傳統預報模式。
今天,我們就來聊聊,這場 23 年悄悄發展的氣象 AI 革命。
現在的天氣預報,其實都先仰賴一台超級電腦,經過數小時的運算,先算出一個大致數值預報。
氣象局的預報員們得到資料後,經過他們的預報經驗,輔佐其他大氣數據,會再做出修正後、更準確的天氣預報。
其中,修正電腦預報這一步,遠比你想像的還重要。
舉個例子,以台灣為例,氣象員們通常有個 feel,當颱風從東南方準備登陸時,通常會有偏向某條河流、或呈現 z 字偏折的狀況。
這種情況通常數值預報掌握不到,就必須仰賴資深的預報員,進行預報修正。
數值預報的計算,其實仰賴了過去數百年的知識。工程師們會把氣象物理知識,寫成 code、演算法,供超級電腦計算。
在每日預報時,工程師會餵入地面觀測站的資料、衛星資料等,讓電腦算個幾小時產生結果。
但數值預報上,有幾大難題。
第一是算力。數值預報因為牽扯龐大的運算,超級電腦真的要很超級。
全球前 500 大超級電腦中,台灣中央氣象局就有兩台,同時正耗資數十億,繼續買超級電腦,因應未來預報需求。
第二是資料缺乏,氣象預報的第一步是資料收集。要做成好的預報,不但需要衛星資料、也要地面觀測站資料。
衛星資料一照可以照一大片地球表面,但地面資料再怎麼努力,太平洋這塊也是少一大塊,山區也是。
而全球數值運算的模型,全世界也有幾大派別,其中最大的兩家,是歐洲的 ECMWF、和美國的 GFS 。
ECMWF 和 GFS 誰好誰壞,有點地域性的因素。普遍來說,台灣鄉民比較喜歡 ECMWF ,在夏秋颱風季 ECMWF 也表現比較好。
ECMWF 也因此成為 Benchmark ,每當有一個 AI Model 誕生時,都要和 ECMWF 一較高下,看誰比較厲害。
2023 年底,由 Google Deepmind 發表的 Graphcast 閃亮登場。登場的第一句話是
Our state-of-the-art model delivers 10-day weather predictions at unprecedented accuracy in under one minute.
Deepmind 團隊宣稱,他們透過過去數十年的氣象資料,讓模型通過 data,學習 pattern,一舉揮別傳統 algorithm-based 的數值預報。
要產出 10 天預報,傳統上,我們需要幾百個 CPU、GPU 的超級電腦,運算好幾小時,跑出數值預報。
現在,只需要一個 Google TPU machine ,跑不到一分鐘,就算出全球模式的預報,準確度甚至可能高於傳統算法。
同時,這個模型還有幾大要點:
因此,不論是在預報上、甚至是算力上,我們都看見了 AI 肌肉的實力,也為中尺度預報展開新的篇章。
相似時間,另一個由 Google Research 和 Deepmind 強力合作的 Model MetNet-3,則在區域預報上刷出亮眼成績。
MetNet-3 推出的牛肉,是以更高頻率、更高解析度邁進。對比於傳統 60min、9km 的預報尺度,MetNet-3 則能以 2min 、1km 的大小進行推論。
與此同時,他能讓你不論身處何地、附近多少氣象站,都還能精準作出預報,送到你手機。
這究竟怎麼達成的?其實細讀 Paper ,就會發現都是常見 Model Training 的技巧。
簡單來說,透過將觀測站的資料切割成兩塊,將 Model 慢慢從 Training Data,Fit 到 Evaluation Data,再透過 spatial parameter sharing 做全境推估。
這讓 model 必須學會如何透過有氣象站的資料,推論沒有氣象站的地點。
更強的是,它每幾分鐘,就吃一次雷達、衛星、觀測站、和傳統模型的推論資料,做未來12小時的實時更新。
因此,不論你身處何處,MetNet-3 都能實時送給你最強天氣預報。
簡單回答是,不行!光是看 MetNet-3 只部署在美國和歐洲大陸,就能看出一點端倪。
以 MetNet-3 為例,預報是建立在氣流是一個連續的過程,透過模型推論,展望未來 12 小時的移動。
但台灣是個典範例子,每到夏天,山區就會突然長一顆一顆超強對流系統,俗稱午後雷陣雨。
這種不太連續、突然長出的系統,MetNet-3 可能無法表現的好,我想這也是為什麼 MetNet-3 還沒應用到低緯度,天氣型態比較複雜的區域。
另一方面,Guo-Yuan 的文章也指出數個 AI 預報的挑戰,比如模型輸出變數不足、區域模式預報的極限,這些都讓傳統數值預報仍有舉足輕重的地位。
就像 Tesla FSD 在 v12 宣稱,他們移除了 30 萬行的 C++ code,在最新的全自動駕駛技術中,完全仰賴 Deep Learning 深度模型。
在氣象領域上,我們也看到同樣趨勢。累積了 50 年的數值預報,仰賴的是科學家數百年,對氣象物理世界的了解。
但現在,一個悄悄誕生的 GNN 模型,隨便 tuned 一下,不但省了 90 幾 % 運算資源,還得到相稱的結果。
The world is shifted to AI-Powered mode. 再搭上 ChatGPT 、Sora 的強勢登場,我總覺得 AI 統治世界,是個短期就會發生的事呢。