第1讲季节时间序列( SARIMA)模型 1.时间序列( ARIMA)模型回顾 时间序列分析方法由Box- Jenkins(1976)年提出。它适用于各种领域的时间序列分析。 时间序列模型不同于经济计量模型的两个特点是: (1)这种建模方法不以经济理论为依据,而是依据变量自身的变化规律,利用外推机 制描述时间序列的变化 (2)明确考虑时间序列的非平稳性。如果时间序列非平稳,建立模型之前应先通过差 分把它变换成平稳的时间序列,再考虑建模问题 时间序列模型的应用 (1)研究时间序列本身的变化规律(何种结构,建立模型,有无确定性趋势,有无单 位根,有无季节性成分)。 (2)在回归模型的预测中首先预测解释变量的值。 (3)非经典经济计量学的基础知识之 滞后算子与差分算子 滞后算子:表示时间滞后的算子,常用L或B表示。例,Lx=x1-1,Lmx1=xn。 差分:时间序列变量的本期值与其滞后值相减的运算叫差分。表示差分运算的算子称作 差分算子,常用1或D表示 差分分为一阶差分和高阶差分,一次差分和高次差分 例,一阶差分4x=x1-x7-1=x-Lx=(1-L)x 例,高阶差分4x=x-xk=x-4x,=(1-L)x 例,二次差分x=(1-L)2x=(1-2L+L2)x=x-2x1+x2 高阶差分常用于季节性数据的差分,如季度数据的4阶差分、月度数据的12阶差分等 滞后算子与差分算子可以直接参与运算 滞后算子有如下性质 (1)常数与滞后算子相乘等于常数。Lc=c (2)滞后算子适用于分配律。(L+D)x=x+Ux=x计+x (3)滞后算子适用于结合律。LDx=x=x+,(D)3x1=UUx=L2x1=x12 (4)滞后算子的零次方等于1。L0x=x (5)滞后算子的负整数次方意味着超前。Lx1=x 中文对时间前后的描述混乱 以前,从前,前年,滞后现在以后,今后,后年,超前 时间 backward. lag. now, lead, forward 几种典型的随机过程 1.白噪声( white noise)过程 对于随机过程{x,t∈T},如果E(x)=0,var(x)=a2<∞,l∈T,Cov(x,x+k)=0,(+k) ∈T,k≠0,则称{x}为白噪声过程。 2.随机游走( random walk)过程 对于下面的表达式
1 第 1 讲 季节时间序列(SARIMA)模型 1.时间序列(ARIMA)模型回顾 时间序列分析方法由 Box-Jenkins (1976) 年提出。它适用于各种领域的时间序列分析。 时间序列模型不同于经济计量模型的两个特点是: (1)这种建模方法不以经济理论为依据,而是依据变量自身的变化规律,利用外推机 制描述时间序列的变化。 (2)明确考虑时间序列的非平稳性。如果时间序列非平稳,建立模型之前应先通过差 分把它变换成平稳的时间序列,再考虑建模问题。 时间序列模型的应用: (1)研究时间序列本身的变化规律(何种结构,建立模型,有无确定性趋势,有无单 位根,有无季节性成分)。 (2)在回归模型的预测中首先预测解释变量的值。 (3)非经典经济计量学的基础知识之一。 滞后算子与差分算子 滞后算子:表示时间滞后的算子,常用 L 或 B 表示。例,Lxt = xt- 1,L n xt = xt- n 。 差分:时间序列变量的本期值与其滞后值相减的运算叫差分。表示差分运算的算子称作 差分算子,常用或 D 表示。 差分分为一阶差分和高阶差分,一次差分和高次差分。 例,一阶差分 xt = xt- xt -1 = xt- L xt = (1- L) xt。 例,高阶差分k xt = xt- xt -k = xt – L k xt = (1- L k ) xt。 例,二次差分 xt = (1- L ) 2 xt = (1 – 2L + L 2 ) xt = xt –2 xt-1+ xt–2。 高阶差分常用于季节性数据的差分,如季度数据的 4 阶差分、月度数据的 12 阶差分等。 滞后算子与差分算子可以直接参与运算。 滞后算子有如下性质。 (1)常数与滞后算子相乘等于常数。Lc = c (2)滞后算子适用于分配律。(L i + L j) xt = L i xt + L j xt = xt -i+ xt –j (3)滞后算子适用于结合律。L i L j xt = L i+ j xt = xt -i–j, (L j) 2xt = L j L j xt = L 2 j xt = xt–2 j (4)滞后算子的零次方等于 1。L 0 xt = xt (5)滞后算子的负整数次方意味着超前。L -i xt = xt+i 中文对时间前后的描述混乱。 以前,从前,前年,滞后 现在 以后,今后,后年,超前 时间 backward, lag, now, lead, forward, 几种典型的随机过程 1.白噪声(white noise)过程 对于随机过程{ xt , tT }, 如果 E(xt) = 0, Var (xt) = 2 , tT; Cov (xt, xt + k) = 0, (t + k ) T , k 0 , 则称{xt}为白噪声过程。 2.随机游走(random walk)过程 对于下面的表达式
如果为白噪声过程,则称x为随机游走(随机游动、随机漫游)过程 3.自回归过程,AR(P) 如果一个剔出均值和确定性成分的线性过程可表达为 xr=中1x1+中2x12+…+中pxp+a 其中叭,=1,…p是自回归参数,是白噪声过程,则称x为p阶自回归过程,用AR(p) 表示。x是由它的p个滞后变量的加权和以及t相加而成。 4.移动平均过程,MA(q) 如果一个剔出均值和确定性成分的线性随机过程可用下式表达 x=l+1l-1+2l2+…+0ql-q=(1+b1L+2L2+…,+bq19)l=OL)u 其中θ1,O2…,O是移动平均参数,b为白噪声过程,则上式称为q阶移动平均过程,记为 MA(q)。之所以称“移动平均”,是因为x是由q+1个u和u滞后项的加权和构造而成。 移动”指t的变化,“平均”指加权和。 5.自回归移动平均过程,ARMA(p,q) 由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均过程,记为 ARMA(P,q),其中p,q分别表示自回归和移动平均部分的最大阶数。ARMA(P,q)的一般表 达式是 x=φux11+px2+.+px+l+11+b2l2+…+bqlq 即 (1-uL-中2L2-,-p)x=(1+b1L+b2L2+…+qLq 或 Φ(L)x=6(L)l 其中Φ(L)和(L)分别表示L的p,q阶特征多项式 ARMA(p,q)过程的平稳性只依赖于其自回归部分,即Φ(L)=0的全部根取值在单位圆 之外(绝对值大于1)。其可逆性则只依赖于移动平均部分,即θ(L)=0的根取值应在单位 圆之外 6.单整(单积)自回归移动平均过程, ARIMA(p,d,q) 考虑如下模型 p(L)Ady=6()u 其中q(L)是一个平稳的自回归算子。即Φ(L)=0的根都大于1。(L)表示可逆的移动平均 算子。O(L)=0的根都大于1。则称y为(p,d,q)阶单整(单积)自回归移动平均过程,记 为 ARIMA(P,d,q)。其中(L)犁称为广义自回归算子 Wold分解定理:任何协方差平稳过程x,都可以被表示为 x-4-,=l+l计+四l2+,,+= ∑v 其中μ表示x的期望。d表示x的线性确定性成分,如周期性成分、时间t的多项式和指 数形式,虚拟变量等,可以直接用x的滞后值预测。%=1,∑V2<∞。为白噪声 过程。表示用x的滞后项预测x时的误差
2 xt = xt -1 + ut 如果 ut 为白噪声过程,则称 xt 为随机游走(随机游动、随机漫游)过程。 3.自回归过程,AR(p) 如果一个剔出均值和确定性成分的线性过程可表达为 xt = 1xt-1 + 2 xt-2 + … + p xt-p + ut , 其中i, i = 1, … p 是自回归参数,ut 是白噪声过程,则称 xt 为 p 阶自回归过程,用 AR(p) 表示。xt是由它的 p 个滞后变量的加权和以及 ut相加而成。 4.移动平均过程,MA(q) 如果一个剔出均值和确定性成分的线性随机过程可用下式表达 xt = ut + 1 ut –1 + 2 ut -2 + … + q ut – q = (1 + 1L + 2 L 2 + … + q L q) ut = L) ut 其中 1, 2, …, q是移动平均参数,ut为白噪声过程,则上式称为 q 阶移动平均过程,记为 MA(q) 。之所以称“移动平均”,是因为 xt 是由 q +1 个 ut 和 ut 滞后项的加权和构造而成。 “移动”指 t 的变化,“平均”指加权和。 5.自回归移动平均过程,ARMA(p, q) 由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均过程,记为 ARMA(p, q), 其中 p, q 分别表示自回归和移动平均部分的最大阶数。ARMA(p, q) 的一般表 达式是 xt = 1xt-1 + 2xt-2 +…+ p xt-p + ut + 1ut-1 + 2 ut-2 + ...+ q ut-q 即 (1 - 1L - 2 L 2 -… - p L p ) xt = (1 + 1 L + 2 L 2+ … + q L q ) ut 或 (L) xt = (L) ut 其中 (L) 和 (L) 分别表示 L 的 p, q 阶特征多项式。 ARMA(p, q) 过程的平稳性只依赖于其自回归部分,即 (L) = 0 的全部根取值在单位圆 之外(绝对值大于 1)。其可逆性则只依赖于移动平均部分,即 (L) = 0 的根取值应在单位 圆之外。 6.单整(单积)自回归移动平均过程,ARIMA (p, d, q) 考虑如下模型 (L) d yt = (L) ut 其中(L) 是一个平稳的自回归算子。即 (L) = 0 的根都大于 1。 (L)表示可逆的移动平均 算子。 (L) = 0 的根都大于 1。则称 yt 为(p, d, q)阶单整(单积)自回归移动平均过程,记 为 ARIMA (p, d, q)。其中 (L) d称为广义自回归算子。 Wold 分解定理:任何协方差平稳过程 xt,都可以被表示为 xt- - dt = ut + 1 ut-1+ 2 ut-2 + … + = j 0 j t j u 其中 表示 xt 的期望。dt 表示 xt 的线性确定性成分,如周期性成分、时间 t 的多项式和指 数形式,虚拟变量等,可以直接用 xt 的滞后值预测。0 = 1, 0 2 j j < ∞。ut 为白噪声 过程。ut表示用 xt的滞后项预测 xt时的误差
E(xr Ix ∑vu-,称为x的线性非确定性成分。当d=0时,称x为纯线性非确定性过程。 对于一般的(漂移项非零)ARMA(p,q过程 P(L)x=a+O(L)ur x的期望是 E(xu=eC 0)×(L以 (a)=2 (L) (1)1--φ 这就是漂移项与均值的关系 所以(1)式也可以写为, d(D(x-1)=6(Ll 任何漂移项非零(含有确定性成分)的平稳过程都可以通过对该序列先退均值(退确定 性成分)再研究。均值的大小并不影响模型的结构。所以以零均值过程硏究模型类型具有代 表性 Y+8 2.季节时间序列模型 在某些时间序列中,存在明显的周期性变化。这种周期是由于季节性变化(包括季度、 月度、周度等变化)或其他一些固有因素引起的。这类序列称为季节性序列。比如一个地区 的气温值序列(每隔一小时取一个观测值)中除了含有以天为周期的变化,还含有以年为周 期的变化。在经济领域中,季节性序列更是随处可见。如季度时间序列、月度时间序列、周 度时间序列等。处理季节性时间序列只用以上介绍的方法是不够的。描述这类序列的模型之 一是季节时间序列模型( seasonal ARIMA mode),用 SARIMA表示。较早文献也称其为乘积 季节模型( multiplicative seasonal model)。 设季节性序列(月度、季度、周度等序列都包括其中)的变化周期为s,即时间间隔为 s的观测值有相似之处。首先用季节差分的方法消除周期性变化。季节差分算子定义为 若季节性时间序列用y表示,则一次季节差分表示为 4y=(1-L)y=y-y-s 对于非平稳季节性时间序列,有时需要进行D次季节差分之后才能转换为平稳的序列。在 此基础上可以建立关于周期为s的P阶自回归Q阶移动平均季节时间序列模型(注意P、Q 等于2时,滞后算子应为(L)2=L2
3 ut = xt - E(xt xt-1, xt-2 , …) j 0 j t j u 称为 xt的线性非确定性成分。当 dt = 0 时,称 xt为纯线性非确定性过程。 对于一般的(漂移项非零)ARMA(p,q)过程, (L) xt = + (L) ut (1) xt的期望是 E(xt) = E( Φ(L) a ) + ( ) ( ) Φ L Θ L E(ut) = Φ(1) a = p a 1-1 - 2 ... = 这就是漂移项与均值的关系 所以(1)式也可以写为, (L) (xt -) = (L) ut (2) 任何漂移项非零(含有确定性成分)的平稳过程都可以通过对该序列先退均值(退确定 性成分)再研究。均值的大小并不影响模型的结构。所以以零均值过程研究模型类型具有代 表性。 -5 0 5 10 15 25 50 75 100 125 150 175 200 Y Y+8 2.季节时间序列模型 在某些时间序列中,存在明显的周期性变化。这种周期是由于季节性变化(包括季度、 月度、周度等变化)或其他一些固有因素引起的。这类序列称为季节性序列。比如一个地区 的气温值序列(每隔一小时取一个观测值)中除了含有以天为周期的变化,还含有以年为周 期的变化。在经济领域中,季节性序列更是随处可见。如季度时间序列、月度时间序列、周 度时间序列等。处理季节性时间序列只用以上介绍的方法是不够的。描述这类序列的模型之 一是季节时间序列模型(seasonal ARIMA model),用 SARIMA 表示。较早文献也称其为乘积 季节模型(multiplicative seasonal model)。 设季节性序列(月度、季度、周度等序列都包括其中)的变化周期为 s,即时间间隔为 s 的观测值有相似之处。首先用季节差分的方法消除周期性变化。季节差分算子定义为, s = 1- L s 若季节性时间序列用 yt表示,则一次季节差分表示为 s yt = (1- L s) yt = yt - yt - s 对于非平稳季节性时间序列,有时需要进行 D 次季节差分之后才能转换为平稳的序列。在 此基础上可以建立关于周期为 s 的 P 阶自回归 Q 阶移动平均季节时间序列模型(注意 P、Q 等于 2 时,滞后算子应为(L s) 2 = L 2s
Ap(L )45n,= Bo(L)ur (260) 对于上述模型,相当于假定v是平稳的、非自相关的。 当u1非平稳且存在ARMA成分时,则可以把描述为 d,(L)A ur =O(L)v, 其中v为白噪声过程,p,q分别表示非季节自回归、移动平均算子的最大阶数,d表示t的 阶(非季节)差分次数。由上式得 l=()4(Lv (262) 把(262)式代入(260)式,于是得到季节时间序列模型的一般表达式。 dp(L)A(L)(44, y )=O(L) BO(LS)VI 其中下标P,Q,P,q分别表示季节与非季节自回归、移动平均算子的最大滞后阶数,d,D分 别表示非季节和季节性差分次数。上式称作(p,d,q)×(P,D,Q)阶季节时间序列模型或乘 积季节模型 保证(44y)具有平稳性的条件是④(L)A(L)=0的根在单位圆外;保证(42y) 具有可逆性的条件是eL)B(L)=0的根在单位圆外。 当P=D=O=0时, SARIMA模型退化为 ARIMA模型;从这个意义上说, ARIMA模 型是 SARIMA模型的特例。当P=D=Q=p=q=d=0时, SARIMA模型退化为白噪声模 型 (1,1,1)×(1,1,1)2阶月度 SARIMA模型表达为 (1-D)(1-a1L12)4A12y=(1+D(1+B1L2)v 412y具有平稳性的条件是|1<1,|a<1,112y具有可逆性的条件是|a<1,|B1 设log(Y=y,变量A412y在 EViews中用DLOG(Y,1,12)表示(这样表示的好处是 EViews 可以直接预测到Y),上式的 EViews估计命令是 DLOG(Y, 1, 12) AR(D) SAR(12) MA(I) SMA(12) (0,1,1)×(0,1,1)2阶月度 SARIMA模型表达为 AA12y=(1+1D)(1+BL2)v (2.64) (264)式的 EViews估计命令是 DLOG(Y, 1, 12) MA(D) SMA(12) 由(2.64)式得 A412y=(1+1L)(1+BL2)v=v+1Lv+B1Dn+6nB1L1v v-1+B1 B Bl 上式对应的 EViews估计命令是 DLOG(Y,1,12)MA(1)MA(12)MA(13) 模型表达式是 +Bhv-1+O2v-12+O3 这是一个非季节模型表达式。以上两个 EViews估计命令是等价的,都是估计MA(13)模型 注意:唯一不同点是上式对v-13的系数的3没有约束,而对季节模型来说,相当于增加 一个约束条件,Oh3=B
4 P (L s) sDyt = Q (L s) ut (2.60) 对于上述模型,相当于假定 ut是平稳的、非自相关的。 当 ut非平稳且存在 ARMA 成分时,则可以把 ut描述为 p (L) dut = q (L) vt (2.61) 其中 vt为白噪声过程,p, q 分别表示非季节自回归、移动平均算子的最大阶数,d 表示 ut的 一阶(非季节)差分次数。由上式得 ut = p -1(L) -d q (L) vt (2.62) 把 (2.62) 式代入 (2.60) 式,于是得到季节时间序列模型的一般表达式。 p(L) P(L s) ( dsDyt) = q(L) Q(L s) vt (2.63) 其中下标 P, Q, p, q 分别表示季节与非季节自回归、移动平均算子的最大滞后阶数,d, D 分 别表示非季节和季节性差分次数。上式称作 (p, d, q) (P, D, Q)s 阶季节时间序列模型或乘 积季节模型。 保证( dsDyt)具有平稳性的条件是p(L)P(L s) = 0 的根在单位圆外;保证( dsDyt) 具有可逆性的条件是q (L)Q (L s) = 0 的根在单位圆外。 当 P = D = Q = 0 时,SARIMA 模型退化为 ARIMA 模型;从这个意义上说,ARIMA 模 型是 SARIMA 模型的特例。当 P = D = Q = p = q = d = 0 时,SARIMA 模型退化为白噪声模 型。 (1, 1, 1) (1, 1, 1)12 阶月度 SARIMA 模型表达为 (1- 1 L) (1- 1 L 12) 12 yt = (1+1 L) (1+1 L 12) vt 12 yt具有平稳性的条件是 1 < 1, 1 < 1, 12 yt具有可逆性的条件是 1 < 1, 1 < 1。 设 log(Yt) = yt,变量 12 yt在 EViews 中用 DLOG(Y,1,12)表示(这样表示的好处是 EViews 可以直接预测到 Y),上式的 EViews 估计命令是 DLOG(Y,1,12) AR(1) SAR(12) MA(1) SMA(12) (0, 1, 1) (0, 1, 1)12 阶月度 SARIMA 模型表达为 12 yt = (1+ 1 L) (1+ 1 L 12) vt (2.64) (2.64) 式的 EViews 估计命令是 DLOG(Y,1,12) MA(1) SMA(12) 由(2.64) 式得 12 yt = (1+1 L) (1+1 L 12 ) vt = vt +1 L vt +1 L 12vt + 1 1 L 13vt = vt +1 vt –1 +1 vt – 12 + 1 1 vt – 13 上式对应的 EViews 估计命令是 DLOG(Y,1,12) MA(1) MA(12) MA(13) 模型表达式是 12 yt = vt +1 vt –1 +12 vt – 12 + 13 vt – 13 这是一个非季节模型表达式。以上两个 EViews 估计命令是等价的,都是估计 MA(13)模型。 注意:唯一不同点是上式对 vt – 13的系数13没有约束,而对季节模型来说,相当于增加 了一个约束条件,13 =1 1
进一步化简 A(y-y-12)=v+bhw-1+B1v-12+hBv-13 4y-4y-12=V+Bv-1+B1v-12+61Bv7-13 用于预测的模型型式是 y=y1+y-12-y-13+v 1v-1+Bnv-12+ 81 Biv (265) 由季节时间序列模型的一般表达式。 dpp(L)Ap(L)(MA y =Oq(L)Bo(LS)VI (263) 可写为 P(L)A(L5)4(4dD )=O(L)BO(LS)Ve (L)4y=6(L)v 其中,(L)=(L)AAL)40,(L)=LBL。从上式可以看出 SARIMA模型(263) 可以展开为 ARIMA(p+PSDS,d,q+QS模型 对乘积季节模型的季节阶数,即周期长度s的识别可以通过对实际问题的分析、时间序 列图以及时间序列的相关图和偏相关图分析得到 以相关图和偏相关图为例,如果相关图和偏相关图不是呈线性衰减趋势,而是在变化周 期的整倍数时点上出现绝对值相当大的峰值并呈振荡式变化,就可以认为该时间序列可以用 SARIMA模型描述 建立 SARIMA模型, (1)首先要确定d,D。通过差分和季节差分把原序列变换为一个平稳的序列。令 (2)然后用x建立中(L)A(L)x=(DB(L)v模型。 注意 (1)用对数的季节时间序列数据建模时通常D不会大于1,P和Q不会大于3 (2)乘积季节模型参数的估计、检验与前面介绍的估计、检验方法相同。利用乘积季 节模型预测也与上面介绍的预测方法类似 3.季节时间序列建模案例 案例1:(文件名:5b2c3)北京市1978:1~198912社会商品零售额月度数据(y,单位: 亿元人民币)曲线见图232,数据见表23。y与时间呈指数关系且存在递增型异方差。对 数的社会商品零售额月度数据(Lny)曲线见图233。Lmy与时间近似呈线性关系(异方差 问题也得到抑制)
5 进一步化简 (yt – yt - 12) = vt +1 vt –1 +1 vt – 12 + 1 1 vt – 13 yt – yt - 12 = vt +1 vt –1 +1 vt – 12 + 1 1 vt – 13 用于预测的模型型式是 yt = yt -1 + yt - 12 – yt – 13 + vt +1 vt –1 +1 vt – 12 + 1 1 vt – 13 (2.65) 由季节时间序列模型的一般表达式。 p(L) P(L s) ( dsDyt) = q(L) Q(L s) vt (2.63) 可写为 p(L) P(L s) sD ( dyt) = q(L) Q(L s) vt *(L) dyt = *(L) vt 其中,*(L) = p(L) P(L s) sD,*(L) = q(L) Q(L s)。从上式可以看出 SARIMA 模型(2.63) 可以展开为 ARIMA(p+PS+DS, d, q+QS) 模型。 对乘积季节模型的季节阶数,即周期长度 s 的识别可以通过对实际问题的分析、时间序 列图以及时间序列的相关图和偏相关图分析得到。 以相关图和偏相关图为例,如果相关图和偏相关图不是呈线性衰减趋势,而是在变化周 期的整倍数时点上出现绝对值相当大的峰值并呈振荡式变化,就可以认为该时间序列可以用 SARIMA 模型描述。 建立 SARIMA 模型, (1)首先要确定 d, D。通过差分和季节差分把原序列变换为一个平稳的序列。令 xt = dsD yt (2)然后用 xt 建立 p (L) P (L s) xt = q (L) Q (L s) vt模型。 注意: (1)用对数的季节时间序列数据建模时通常 D 不会大于 1,P 和 Q 不会大于 3。 (2)乘积季节模型参数的估计、检验与前面介绍的估计、检验方法相同。利用乘积季 节模型预测也与上面介绍的预测方法类似。 3.季节时间序列建模案例 案例 1:(文件名:5b2c3)北京市 1978:1~1989:12 社会商品零售额月度数据(yt,单位: 亿元人民币)曲线见图 2.32,数据见表 2.3。yt与时间呈指数关系且存在递增型异方差。对 数的社会商品零售额月度数据(Ln yt)曲线见图 2.33。Lnyt与时间近似呈线性关系(异方差 问题也得到抑制)