當氣象預報也 AI Powered

更新於 發佈於 閱讀時間約 7 分鐘

近期 Sora 重磅推出,各種超實影片散佈社群平台,重現了 2022 年 ChatGPT 推出時的面貌。

這讓大眾以為,2023 年的 AI 革命主旋律,就是圍繞 ChatGPT、Sora,這種 GenAI 類型的革命。

但事實上,和人們日常息息相關的氣象預報,在 2023 年也同樣掀起 AI 革命,直接挑戰了傳統預報模式。

今天,我們就來聊聊,這場 23 年悄悄發展的氣象 AI 革命。

現在怎麼做天氣預報?

raw-image

現在的天氣預報,其實都先仰賴一台超級電腦,經過數小時的運算,先算出一個大致數值預報。

氣象局的預報員們得到資料後,經過他們的預報經驗,輔佐其他大氣數據,會再做出修正後、更準確的天氣預報。

其中,修正電腦預報這一步,遠比你想像的還重要。

舉個例子,以台灣為例,氣象員們通常有個 feel,當颱風從東南方準備登陸時,通常會有偏向某條河流、或呈現 z 字偏折的狀況。

這種情況通常數值預報掌握不到,就必須仰賴資深的預報員,進行預報修正。

數值預報怎麼做?

ECMWF HiRes Model Precipitable Water - MyFoxHurricane.com

ECMWF HiRes Model Precipitable Water - MyFoxHurricane.com

數值預報的計算,其實仰賴了過去數百年的知識。工程師們會把氣象物理知識,寫成 code、演算法,供超級電腦計算。

在每日預報時,工程師會餵入地面觀測站的資料、衛星資料等,讓電腦算個幾小時產生結果。

但數值預報上,有幾大難題。

第一是算力。數值預報因為牽扯龐大的運算,超級電腦真的要很超級。

全球前 500 大超級電腦中,台灣中央氣象局就有兩台,同時正耗資數十億,繼續買超級電腦,因應未來預報需求

第二是資料缺乏,氣象預報的第一步是資料收集。要做成好的預報,不但需要衛星資料、也要地面觀測站資料。

衛星資料一照可以照一大片地球表面,但地面資料再怎麼努力,太平洋這塊也是少一大塊,山區也是。

而全球數值運算的模型,全世界也有幾大派別,其中最大的兩家,是歐洲的 ECMWF、和美國的 GFS 。

ECMWF 和 GFS 誰好誰壞,有點地域性的因素。普遍來說,台灣鄉民比較喜歡 ECMWF ,在夏秋颱風季 ECMWF 也表現比較好。

ECMWF 也因此成為 Benchmark ,每當有一個 AI Model 誕生時,都要和 ECMWF 一較高下,看誰比較厲害。

Graphcast Model 的閃亮推出

2023 年底,由 Google Deepmind 發表的 Graphcast 閃亮登場。登場的第一句話是

Our state-of-the-art model delivers 10-day weather predictions at unprecedented accuracy in under one minute.

Deepmind 團隊宣稱,他們透過過去數十年的氣象資料,讓模型通過 data,學習 pattern,一舉揮別傳統 algorithm-based 的數值預報。

要產出 10 天預報,傳統上,我們需要幾百個 CPU、GPU 的超級電腦,運算好幾小時,跑出數值預報。

現在,只需要一個 Google TPU machine ,跑不到一分鐘,就算出全球模式的預報,準確度甚至可能高於傳統算法。

同時,這個模型還有幾大要點:

  • 不像 23 年 GenAI-based model 是 Transformer,Graphcast 是用 Graph Neural Networks (GNNs),在物理空間上,表現較有優勢的基底模型。
  • 0.25 精度的解析度,約 28km x 28km 的大小。投射地球上,有超過百萬個數格(grids)。
  • 在對流層不同高度上,可以產出溫度、風速、風向、濕度、氣壓等預測。
  • 在極端氣候上,例如颱風路徑預測、熱浪,表現都不亞於傳統算法。

因此,不論是在預報上、甚至是算力上,我們都看見了 AI 肌肉的實力,也為中尺度預報展開新的篇章。

MetNet-3 的強力輔佐

相似時間,另一個由 Google Research 和 Deepmind 強力合作的 Model MetNet-3,則在區域預報上刷出亮眼成績。

MetNet-3 推出的牛肉,是以更高頻率、更高解析度邁進。對比於傳統 60min、9km 的預報尺度,MetNet-3 則能以 2min 、1km 的大小進行推論。

與此同時,他能讓你不論身處何地、附近多少氣象站,都還能精準作出預報,送到你手機。

這究竟怎麼達成的?其實細讀 Paper ,就會發現都是常見 Model Training 的技巧。

簡單來說,透過將觀測站的資料切割成兩塊,將 Model 慢慢從 Training Data,Fit 到 Evaluation Data,再透過 spatial parameter sharing 做全境推估。

這讓 model 必須學會如何透過有氣象站的資料,推論沒有氣象站的地點。

更強的是,它每幾分鐘,就吃一次雷達、衛星、觀測站、和傳統模型的推論資料,做未來12小時的實時更新。

因此,不論你身處何處,MetNet-3 都能實時送給你最強天氣預報。

那我們可以丟掉數值預報了嗎?

簡單回答是,不行!光是看 MetNet-3 只部署在美國和歐洲大陸,就能看出一點端倪。

以 MetNet-3 為例,預報是建立在氣流是一個連續的過程,透過模型推論,展望未來 12 小時的移動。

但台灣是個典範例子,每到夏天,山區就會突然長一顆一顆超強對流系統,俗稱午後雷陣雨。

雨彈來了!午後對流旺盛16縣市大雨特報│下雨│中央氣象局│對流雲系│TVBS新聞網

雨彈來了!午後對流旺盛16縣市大雨特報│下雨│中央氣象局│對流雲系│TVBS新聞網

這種不太連續、突然長出的系統,MetNet-3 可能無法表現的好,我想這也是為什麼 MetNet-3 還沒應用到低緯度,天氣型態比較複雜的區域。

另一方面,Guo-Yuan 的文章也指出數個 AI 預報的挑戰,比如模型輸出變數不足、區域模式預報的極限,這些都讓傳統數值預報仍有舉足輕重的地位。

一次經典的 Paradigm Shift - 典範轉移

Tesla FSD v12 Rolls Out

Tesla FSD v12 Rolls Out

就像 Tesla FSD 在 v12 宣稱,他們移除了 30 萬行的 C++ code,在最新的全自動駕駛技術中,完全仰賴 Deep Learning 深度模型。

在氣象領域上,我們也看到同樣趨勢。累積了 50 年的數值預報,仰賴的是科學家數百年,對氣象物理世界的了解。

但現在,一個悄悄誕生的 GNN 模型,隨便 tuned 一下,不但省了 90 幾 % 運算資源,還得到相稱的結果。

The world is shifted to AI-Powered mode. 再搭上 ChatGPT 、Sora 的強勢登場,我總覺得 AI 統治世界,是個短期就會發生的事呢。

旅美工程師,閒談矽谷與北美的各種樣貌。 #矽谷 #工程師生涯 #旅行 #軟體工程 #個人成長 Medium: medium.com/mencher-publication
留言
avatar-img
留言分享你的想法!
你可能也想看
Google News 追蹤
Thumbnail
該來的終究還是來了 度過焦躁不安的一整周,學徒老人家我的不安感等比級數的襲來,自3/19寫了第一篇關於<巴克萊銀行:倉促撤退>的報告,看到市場上的機構法人有如大洪水、地震來臨前夕開始竄逃撤退。 海湖莊園協議 接著,在3/31與4/2兩天接著寫了川普與他的財經團隊在海湖莊園豪
Thumbnail
空單爆天量、技術指標超賣、情緒恐慌到極致:美股嘎空行情有機會啟動嗎? 重點摘要: 技術面極度超賣,反彈條件醞釀中,但尚未明確止穩 SPY 與 QQQ 的重要指標,如MACD、KDJ、RSI等指標進入極端超賣區,但尚未出現底部鈍化或明確反轉訊號,技術面仍屬空方主導。 連續出現跳空缺口,空方動
Thumbnail
全新 vocus 挑戰活動「方格人氣王」來啦~四大挑戰任你選,留言 / 愛心 / 瀏覽數大 PK,還有新手專屬挑戰!無論你是 vocus 上活躍創作者或剛加入的新手,都有機會被更多人看見,獲得站上版位曝光&豐富獎勵!🏆
Thumbnail
該來的終究還是來了 度過焦躁不安的一整周,學徒老人家我的不安感等比級數的襲來,自3/19寫了第一篇關於<巴克萊銀行:倉促撤退>的報告,看到市場上的機構法人有如大洪水、地震來臨前夕開始竄逃撤退。 海湖莊園協議 接著,在3/31與4/2兩天接著寫了川普與他的財經團隊在海湖莊園豪
Thumbnail
空單爆天量、技術指標超賣、情緒恐慌到極致:美股嘎空行情有機會啟動嗎? 重點摘要: 技術面極度超賣,反彈條件醞釀中,但尚未明確止穩 SPY 與 QQQ 的重要指標,如MACD、KDJ、RSI等指標進入極端超賣區,但尚未出現底部鈍化或明確反轉訊號,技術面仍屬空方主導。 連續出現跳空缺口,空方動
Thumbnail
全新 vocus 挑戰活動「方格人氣王」來啦~四大挑戰任你選,留言 / 愛心 / 瀏覽數大 PK,還有新手專屬挑戰!無論你是 vocus 上活躍創作者或剛加入的新手,都有機會被更多人看見,獲得站上版位曝光&豐富獎勵!🏆