天天看點

bagging和時間序列預測_時間序列預測(中)

上一篇文章我們介紹的時間預測的方法基本都是通過曆史資料直接求平均算出來的的。這一篇講一些用模型來預測的方法。

(p)模型

先講第一個AR模型,AR的全稱是Auto Regression,表示自回歸,大家應該都知道普通的回歸方程,都是用x去回歸y,這裡的x和y一般不是同一個東西。而我們這裡的自回歸顧名思義就是用自己回歸自己,也就是x和y都是時間序列自己。具體的模型如下:

上面模型中,Xt表示t期的值,當期的值由前p期的值來決定,δ值是常數項,相當于普通回歸中的截距項,μ是随機誤差,因為當期值總有一些因素是我們沒考慮進去的,而這些因素帶來的的當期值的改變,我們就把它歸到μ部分中。

AR模型與我們前面講過的權重平均之間的差別就是多了常數項和誤差項。

(q)模型

MA的全稱是Moving Average,表示移動平均。具體模型如下:

上面模型中,Xt表示t期的值,當期的值由前q期的誤內插補點來決定,μ值是常數項,相當于普通回歸中的截距項,ut是當期的随機誤差。MA模型的核心思想是每一期的随機誤差都會影響當期值,把前q期的所有誤差加起來就是對t期值的影響。

(p,q)模型

ARMA模型其實就是把上面兩個模型進行合并,就是認為t期值不僅與前p期的x值有關,而且還與前q期對應的每一期的誤差有關,這兩部分共同決定了目前t期的值,具體的模型如下:

(p,d,q)模型

ARIMA模型是在ARMA模型的基礎上進行改造的,ARMA模型是針對t期值進行模組化的,而ARIMA是針對t期與t-d期之間內插補點進行模組化,我們把這種不同期之間做差稱為差分,這裡的d是幾就是幾階差分。

還是拿gdp資料為例,下圖就是一階差分以及一階差分以後的結果:

下圖為一階差分前後的gdp趨勢圖,可以看出實際gdp值為持續上升趨勢,差分後變成了随機波動:

ARIMA的的具體模型如下:

上面公式中的wt表示t期經過d階差分以後的結果。我們可以看到ARIMA模型的形式基本與ARMA的形式是一緻的,隻不過把X換成了w。

5.最後

當資料是平穩時間序列時可以使用前面的三個模型,當資料是非平穩時間序列時,可以使用最後一個,通過差分的方式将非平穩時間時間序列轉化為平穩時間序列。

以上就是常用的對時間序列預測的統計模型。