Boo.Ideas
2026/04/26·

001 timesfm

上課聽到 timesfm,有聽到就找來玩看看。順便來實驗看看庫存管理的業務邏輯大概可以怎樣實現。


timesfm主打時間序列的zero-shot forecasting基礎模型,一個跑過大量訓練資料的預訓練 model,再依照下游需求微調去適任各種時間序列預測任務。


了解到了一些概念,像是 :
patching - 把一段時間的時間點視為一個 token,捕捉一個區塊的 pattern 比起一個時間點視為一個 token 還要有效。稀疏的資訊有時提供不了線索,不如看局部的趨勢,就像 CV 看區塊不是看一個像素。
最早時序預測都直接搬NLP那套採逐點輸入,後來 PatchTST 提出 patch 跟通道獨立 -反直覺的把多變量拆成多個單變量,但訓練同一組參數,結果準確性大增。


採用 decoder-only,所以 output patch length 可以大於 input patch length (可以基於自己的預測再去預測,就像語言模型)。


因為預測 patch 更長,所以可以用較少的預測次數達到同樣尺寸的預測區間,實作上長期表現上看起來更穩,循環次數越少,誤差累積的機會也較少,而 trade off 是預測靈敏度較低。


限制 - timesfm 只能跑單變量時間序列預測,如果要多變量要做其它的處理(XReg 還沒試過)。另外嘗試了最信更新的 timesfm - transformer 架構版本,可以直接針對下游任務跑 LoRA 優化, 原來 LoRA 在時間序列上也有用。


玩模型的時候,順便測試了reorder的基本邏輯,加上 timesfm 有 quantile head prediction 可以來充當高低區間預測。

    成為會員即可加入討論