2024-03-20|閱讀時間 ‧ 約 27 分鐘

當氣象預報也 AI Powered

近期 Sora 重磅推出,各種超實影片散佈社群平台,重現了 2022 年 ChatGPT 推出時的面貌。

這讓大眾以為,2023 年的 AI 革命主旋律,就是圍繞 ChatGPT、Sora,這種 GenAI 類型的革命。

但事實上,和人們日常息息相關的氣象預報,在 2023 年也同樣掀起 AI 革命,直接挑戰了傳統預報模式。

今天,我們就來聊聊,這場 23 年悄悄發展的氣象 AI 革命。

現在怎麼做天氣預報?

現在的天氣預報,其實都先仰賴一台超級電腦,經過數小時的運算,先算出一個大致數值預報。

氣象局的預報員們得到資料後,經過他們的預報經驗,輔佐其他大氣數據,會再做出修正後、更準確的天氣預報。

其中,修正電腦預報這一步,遠比你想像的還重要。

舉個例子,以台灣為例,氣象員們通常有個 feel,當颱風從東南方準備登陸時,通常會有偏向某條河流、或呈現 z 字偏折的狀況。

這種情況通常數值預報掌握不到,就必須仰賴資深的預報員,進行預報修正。

數值預報怎麼做?

ECMWF HiRes Model Precipitable Water - MyFoxHurricane.com

數值預報的計算,其實仰賴了過去數百年的知識。工程師們會把氣象物理知識,寫成 code、演算法,供超級電腦計算。

在每日預報時,工程師會餵入地面觀測站的資料、衛星資料等,讓電腦算個幾小時產生結果。

但數值預報上,有幾大難題。

第一是算力。數值預報因為牽扯龐大的運算,超級電腦真的要很超級。

全球前 500 大超級電腦中,台灣中央氣象局就有兩台,同時正耗資數十億,繼續買超級電腦,因應未來預報需求

第二是資料缺乏,氣象預報的第一步是資料收集。要做成好的預報,不但需要衛星資料、也要地面觀測站資料。

衛星資料一照可以照一大片地球表面,但地面資料再怎麼努力,太平洋這塊也是少一大塊,山區也是。

而全球數值運算的模型,全世界也有幾大派別,其中最大的兩家,是歐洲的 ECMWF、和美國的 GFS 。

ECMWF 和 GFS 誰好誰壞,有點地域性的因素。普遍來說,台灣鄉民比較喜歡 ECMWF ,在夏秋颱風季 ECMWF 也表現比較好。

ECMWF 也因此成為 Benchmark ,每當有一個 AI Model 誕生時,都要和 ECMWF 一較高下,看誰比較厲害。

Graphcast Model 的閃亮推出

2023 年底,由 Google Deepmind 發表的 Graphcast 閃亮登場。登場的第一句話是

Our state-of-the-art model delivers 10-day weather predictions at unprecedented accuracy in under one minute.

Deepmind 團隊宣稱,他們透過過去數十年的氣象資料,讓模型通過 data,學習 pattern,一舉揮別傳統 algorithm-based 的數值預報。

要產出 10 天預報,傳統上,我們需要幾百個 CPU、GPU 的超級電腦,運算好幾小時,跑出數值預報。

現在,只需要一個 Google TPU machine ,跑不到一分鐘,就算出全球模式的預報,準確度甚至可能高於傳統算法。

同時,這個模型還有幾大要點:

  • 不像 23 年 GenAI-based model 是 Transformer,Graphcast 是用 Graph Neural Networks (GNNs),在物理空間上,表現較有優勢的基底模型。
  • 0.25 精度的解析度,約 28km x 28km 的大小。投射地球上,有超過百萬個數格(grids)。
  • 在對流層不同高度上,可以產出溫度、風速、風向、濕度、氣壓等預測。
  • 在極端氣候上,例如颱風路徑預測、熱浪,表現都不亞於傳統算法。

因此,不論是在預報上、甚至是算力上,我們都看見了 AI 肌肉的實力,也為中尺度預報展開新的篇章。

MetNet-3 的強力輔佐

相似時間,另一個由 Google Research 和 Deepmind 強力合作的 Model MetNet-3,則在區域預報上刷出亮眼成績。

MetNet-3 推出的牛肉,是以更高頻率、更高解析度邁進。對比於傳統 60min、9km 的預報尺度,MetNet-3 則能以 2min 、1km 的大小進行推論。

與此同時,他能讓你不論身處何地、附近多少氣象站,都還能精準作出預報,送到你手機。

這究竟怎麼達成的?其實細讀 Paper ,就會發現都是常見 Model Training 的技巧。

簡單來說,透過將觀測站的資料切割成兩塊,將 Model 慢慢從 Training Data,Fit 到 Evaluation Data,再透過 spatial parameter sharing 做全境推估。

這讓 model 必須學會如何透過有氣象站的資料,推論沒有氣象站的地點。

更強的是,它每幾分鐘,就吃一次雷達、衛星、觀測站、和傳統模型的推論資料,做未來12小時的實時更新。

因此,不論你身處何處,MetNet-3 都能實時送給你最強天氣預報。

那我們可以丟掉數值預報了嗎?

簡單回答是,不行!光是看 MetNet-3 只部署在美國和歐洲大陸,就能看出一點端倪。

以 MetNet-3 為例,預報是建立在氣流是一個連續的過程,透過模型推論,展望未來 12 小時的移動。

但台灣是個典範例子,每到夏天,山區就會突然長一顆一顆超強對流系統,俗稱午後雷陣雨。

雨彈來了!午後對流旺盛16縣市大雨特報│下雨│中央氣象局│對流雲系│TVBS新聞網

這種不太連續、突然長出的系統,MetNet-3 可能無法表現的好,我想這也是為什麼 MetNet-3 還沒應用到低緯度,天氣型態比較複雜的區域。

另一方面,Guo-Yuan 的文章也指出數個 AI 預報的挑戰,比如模型輸出變數不足、區域模式預報的極限,這些都讓傳統數值預報仍有舉足輕重的地位。

一次經典的 Paradigm Shift - 典範轉移

Tesla FSD v12 Rolls Out

就像 Tesla FSD 在 v12 宣稱,他們移除了 30 萬行的 C++ code,在最新的全自動駕駛技術中,完全仰賴 Deep Learning 深度模型。

在氣象領域上,我們也看到同樣趨勢。累積了 50 年的數值預報,仰賴的是科學家數百年,對氣象物理世界的了解。

但現在,一個悄悄誕生的 GNN 模型,隨便 tuned 一下,不但省了 90 幾 % 運算資源,還得到相稱的結果。

The world is shifted to AI-Powered mode. 再搭上 ChatGPT 、Sora 的強勢登場,我總覺得 AI 統治世界,是個短期就會發生的事呢。

分享至
成為作者繼續創作的動力吧!
從 Google News 追蹤更多 vocus 的最新精選內容從 Google News 追蹤更多 vocus 的最新精選內容

作者的相關文章

發表回應

成為會員 後即可發表留言
© 2024 vocus All rights reserved.