在許多領域當中,我們常會需要處理按照時間先後順序所形成的序列資料,這類型的資料我們稱之為時間序列(time series),像是金融領域裡預測股價的應用或是醫療領域裡心電圖的分析等,都是常見之時間序列,然而,要有效的分析時間序列一直都不是個簡單的事情。
一個時間序列通常可以被分解成四個部分,長期趨勢、季節變動、循環波動以及隨機波動。
長期趨勢指的是資料在一段時間內逐漸向上或向下的移動,例如人類近幾年來排放的二氧化碳數量逐年增加,其時間序列的趨勢很明顯就是往上的。
在來是季節變動,季節變動代表的是時間序列因某些季節因子而產生固定且週期性的波動,例如,每年12月聖誕節前夕,許多人都會為了慶祝此節日而產生更多的消費,而電商平台當月的銷售額也會因此增加,仔細觀察許多電商平台年銷售額之時間序列,往往就能看得出明顯的季節性。
循環波動指的是時間序列上所產生之不定期的波動,或是週期比較沒有那麼明確的波動,例如股票市場常每隔幾年會從多頭走向空頭趨勢,但我們卻無法精準且明確知道其多空頭的間隔要多久。
至於隨機波動就是所謂的不可預期之雜訊,它們通常沒有可以識別的形式,對於分析時間序列來說,是個相當頭疼的一部分。
然而,到底過去所發生的資料是否能預測未來呢?這個問題一直是分析時間序列最重要的事情之一,根據數學家發現,唯有時間序列呈現平穩狀態(*),此序列才比較有可能被有效分析及預測。
那麼如果一個時間序列不是平穩的時間數列該怎麼辦呢?在數學上我們能使用所謂的移動平均發、d階差分等技巧,來讓時間序列傳換成平穩狀態,進而可以分析預測。
時間序列一直是一門博大精深的學問,也是許多專家學者正在努力嘗試突破的問題之一呢!
(*)所謂的平穩性指的是,一個時間序列的統計特性不因時間的變動而改變,即時間序列波型的平均、標準差、共變異數均不因時間改變而變動
*本文由知名AI講師-Isaac Lee 李厚均所撰寫