自回歸(autoregressive)模型是一種在機器學習和統計學中常用的方法,主要用來處理序列數據的預測。它的基本概念是:序列中的當前值是過去值的函數,藉由利用序列中先前的數據點來預測下一個數據點。
具體來說,自回歸模型會根據時間序列中前面一段時間(稱為滯後期數)的觀測值,透過線性組合與隨機誤差來估計當前的數值。
這類模型廣泛應用於時間序列分析,例如股價預測、氣象預報等等。在自然語言處理中,也有稱為自回歸語言模型的架構,例如 GPT 類模型,透過先前的詞語序列一步步預測下一個詞語。總結要點:
- 自回歸模型基於「自身過去值預測自身未來值」的原理,
- 是一種線性模型,但複雜模型會加入非線性變化,
- 重要的統計工具中,透過自相關性度量序列內部的時間相依關係,
- 在生成式模型中用於逐步生成序列(如文本、語音等)。