第2讲ARMA模型的干扰分析 ARMA模型的干扰分析就是对平稳时间序列的均值变化进行显著性检验。先以AR(1) 过程为例, 其中1,表示随机误差项,D表示虚拟变量。定义如下: D lt≥4 其中t表示干扰时点。对(1)式两侧求期望,可得到y的长期均值。当【<t时,干扰前的 长期均值是 E() 当t≥1,干扰后的长期均值是 E(v)= a+r 那么施加干扰后对系统的长期影响是 对于MA(1)过程,干扰分析的表达式是 y=A+u+ a ur-1+y 干扰前的长期均值是 E() 当1≥1,干扰后的长期均值是 E()=+y 那么施加干扰后对系统的长期影响是 对于ARMA过程, y=a+aL)yi1+AL)u+yD (4) 其中q(L)和(L)分别是y1和t的滞后算子,干扰分析如下 干扰前的长期均值是 当t≥t,干扰后的长期均值是 E()= a+y 1-φ(L 那么施加干扰对系统的长期影响是 Φ(L)1-(L)1-(L
1 第 2 讲 ARMA 模型的干扰分析 ARMA 模型的干扰分析就是对平稳时间序列的均值变化进行显著性检验。先以 AR(1) 过程为例, yt = + 1 yt-1 + D + ut, 1 < 1 (1) 其中 ut,表示随机误差项,D 表示虚拟变量。定义如下: D = i i t t t t 1, 0, (2) 其中 ti 表示干扰时点。对(1)式两侧求期望,可得到 yt 的长期均值。当 t < ti 时,干扰前的 长期均值是 E(yt) = 1 1 − 当 t ti,干扰后的长期均值是 E(yt) = 1 1 − + 那么施加干扰后对系统的长期影响是 1 1 − + - 1 1 − = 1 1 − 对于 MA(1)过程,干扰分析的表达式是 yt = + ut + 1 ut-1 + D (3) 干扰前的长期均值是 E(yt) = 当 t ti,干扰后的长期均值是 E(yt) = + 那么施加干扰后对系统的长期影响是 ( + ) - = 对于 ARMA 过程, yt = + (L) yt-1 +(L)ut + D (4) 其中(L)和(L)分别是 yt-1 和 ut 的滞后算子,干扰分析如下。 干扰前的长期均值是 E(yt) = 1−Φ(L) 当 t ti,干扰后的长期均值是 E(yt) = 1−Φ(L) + 那么施加干扰对系统的长期影响是 1−Φ(L) + - 1−Φ(L) = 1−Φ(L)
总结如下表 过程类型干扰前的长期均值干扰后的长期均值干扰对系统的长期影响 AR(1) ARMA(P, q) (L) AA(1) u+y MA(q) 可以总结出如下两点: (1)只要过程中存在自回归(AR)分量,那么无论有无移动平均分量(MA)以及移 动平均分量滞后期有多长,对于干扰前后的均值都无影响。 (2)对于纯移动平均过程,无论滞后期有多长,干扰分析的结论相同。 对系统的干扰可以分成若干种类型,包括阶跃式干扰、脉冲式干扰、渐进式干扰、衰退 式干扰等。(2)式表达的属于阶跃式干扰(如图1)。 图1阶跃( level)式干扰 比如中国就业人员数统计,从1990年起包括了对农民工的统计。这种变化属于对中国 就业人员数序列的阶跃式干扰。因为1990年以后将都按这种方式统计。 脉冲式干扰见图2。其定义是 lL,t=t, 其中t表示干扰时点。 七如中国人口年死亡率序列中在1960年就存在脉冲式冲击。 2
2 总结如下表: 过程类型 干扰前的长期均值 干扰后的长期均值 干扰对系统的长期影响 AR(1) 1 1 − 1 1 − + 1 1 − ARMA (p, q) 1−Φ(L) 1−Φ(L) + 1−Φ(L) MA(1) + MA ( q) + 可以总结出如下两点: (1)只要过程中存在自回归(AR)分量,那么无论有无移动平均分量(MA)以及移 动平均分量滞后期有多长,对于干扰前后的均值都无影响。 (2)对于纯移动平均过程,无论滞后期有多长,干扰分析的结论相同。 对系统的干扰可以分成若干种类型,包括阶跃式干扰、脉冲式干扰、渐进式干扰、衰退 式干扰等。(2)式表达的属于阶跃式干扰(如图 1)。 0.0 0.5 1.0 1.5 25 50 75 100 125 150 175 200 DL 图 1 阶跃(level)式干扰 比如中国就业人员数统计,从 1990 年起包括了对农民工的统计。这种变化属于对中国 就业人员数序列的阶跃式干扰。因为 1990 年以后将都按这种方式统计。 脉冲式干扰见图 2。其定义是 DP= = i i t t t t 1, 0, 其中 ti 表示干扰时点。 比如中国人口年死亡率序列中在 1960 年就存在脉冲式冲击。 ti
DEATHRATE 0.5 0.0 25150175200 图2脉冲( pulse)式干扰 中国人口死亡率(fle:6popu-rate) 累进式干扰见图3。其定义是 ln≤<l2 其中l,l表示干扰时点 number o new students B9099998co04 图3累进( slope)式 中国高校年招生人数(万人)(fle: datal) 比如中国教育部近年来实施的普通高校扩招计划。这种扩招计划不是在一年内完成的 而是通过在连续若干年内的努力才使中国普通高校学生数序列达到一个新的水平,这相当于 对中国普通高校学生数序列加载了一个渐进式冲击。 又如在农业生产领域推广水稻优良品种,这个过程不是在一年中完成的,而是经过 干年的努力从而使水稻产量达到一个新水平。 衰退式干扰见图4。其定义是 D 其中,12表示干扰时点
3 0.0 0.5 1.0 1.5 25 50 75 100 125 150 175 200 DP 4 8 12 16 20 24 28 50 55 60 65 70 75 80 85 90 95 DEATHRATE 图 2 脉冲(pulse)式干扰 中国人口死亡率(file:6popu-rate) 累进式干扰见图 3。其定义是 D = 2 1 2 1 2 1 1 1, , 0, i i i i i i i t t t t t t t t t t t − − 其中 ti1, ti2 表示干扰时点。 0.0 0.5 1.0 1.5 25 50 75 100 125 150 175 200 DT 0 100 200 300 400 500 86 88 90 92 94 96 98 00 02 04 number of new students 图 3 累进(slope)式 中国高校年招生人数(万人)(file:data1) 比如中国教育部近年来实施的普通高校扩招计划。这种扩招计划不是在一年内完成的, 而是通过在连续若干年内的努力才使中国普通高校学生数序列达到一个新的水平,这相当于 对中国普通高校学生数序列加载了一个渐进式冲击。 又如在农业生产领域推广水稻优良品种,这个过程不是在一年中完成的,而是经过若 干年的努力从而使水稻产量达到一个新水平。 衰退式干扰见图 4。其定义是 D = 2 1 2 1 2 1 1 0, 1 , 0, i i i i i i i t t t t t t t t t t t − − − 其中 ti1, ti2 表示干扰时点。 ti1 ti2 ti
图4衰退式 根据不同的干扰模式还可以写出若干种其他类型的干扰表达式。如倒Ⅴ字型干扰、梯 形干扰、阶梯形干扰等 例1(ile:5 break4)中国全国居民对数的消费水平时间序列(1952~1997)见图1l.1 从图中可以明显的看出1978年改革开放以后,对数的居民消费水平增加速度明显高于改革 开放之前 28 DLOGY 20 00 Lnyt DUmmy 对对数的消费水平序列差分得差分序列如图。两个时期的均值分别是00320和01234 由于经济的快速发展,改革开放以后的消费水平比改革开放以前有了显著的提高。利用干扰 模型分析这种提高是否存在显著性。设定虚拟变量如下, 0.1953≤t≤1977 l,1978≤t≤1997 得估计结果如下, DEnY=0.0321+0.1030D1+v+0.93671 (2.1)(4.8) (154) R2=069,Q(15)=7.5<x20(14)=237,DW=24,7=45,(1952~1997) 由于D1的系数存在显著性(=48),说明改革开放的政策确实给居民的消费水平带来 很大提高。干扰分析是 0.0321,1953≤t≤197 E(DUnYi= 0.1351,1978≤t≤1997 改革开放以前对数的消费水平年增均值是0.0321,改革开放以后的消费水平年增均值是 1351。改革开放的政策带来的提高是0.1030 估计过程是用DnY先对常数和虚拟变量D回归,然后通过相关图分析残差序列的结 构。这是一个一阶移动平均过程。最终建立模型如上式
4 0.0 0.5 1.0 1.5 25 50 75 100 125 150 175 200 D 图 4 衰退式 根据不同的干扰模式还可以写出若干种其他类型的干扰表达式。如倒 V 字型干扰、梯 形干扰、阶梯形干扰等。 例 1 (file:5break4)中国全国居民对数的消费水平时间序列(19521997)见图 11.12。 从图中可以明显的看出 1978 年改革开放以后,对数的居民消费水平增加速度明显高于改革 开放之前。 4 5 6 7 8 55 60 65 70 75 80 85 90 95 LOG(Y) -.08 -.04 .00 .04 .08 .12 .16 .20 .24 .28 55 60 65 70 75 80 85 90 95 DLOG(Y) Lnyt D Lnyt 对对数的消费水平序列差分得差分序列如图。两个时期的均值分别是 0.0320 和 0.1234。 由于经济的快速发展,改革开放以后的消费水平比改革开放以前有了显著的提高。利用干扰 模型分析这种提高是否存在显著性。设定虚拟变量如下, D1= 1, 1978 1997 0, 1953 1977 t t 得估计结果如下, DLnYt = 0.0321 + 0.1030 D1 + vt + 0.9367vt-1 (2.1) (4.8) (15.4) R 2 = 0.69, Q(15) = 7.5 < 2 0.05 (14) = 23.7, DW=2.4, T= 45,(19521997) 由于 D1 的系数存在显著性(t = 4.8),说明改革开放的政策确实给居民的消费水平带来 很大提高。干扰分析是 E(DLnYt) = 0.1351, 1978 1997 0.0321, 1953 1977 t t 改革开放以前对数的消费水平年增均值是 0.0321,改革开放以后的消费水平年增均值是 0.1351。改革开放的政策带来的提高是 0.1030。 估计过程是用 DLnYt 先对常数和虚拟变量 D1 回归,然后通过相关图分析残差序列的结 构。这是一个一阶移动平均过程。最终建立模型如上式。 ti1 ti2
Autocorrelation Partial Correlation Ac PAc Q-Stat Prob 20.1520234434370.114 30.1060003490970.179 40.140.166597640.201 5-008400186.34740.274 600460085646270.373 70.1400.167755110.374 801530018889260.351 Method: Least Squares Sample(adjusted): 1953 199 Included obserations: 45 after adjustments Convergence achieved after 14 iterations Backcast: 1952 Variable Coefficient Std Error t-Statistic Prob 00321490015488 07574100441 0.10300002125748456390000 MA(1) 09356720050744154200800000 R-squared 0. 687750 Mean dependent var 0.079276 Adjusted R-squared 0.672881 S.D. dependent var 0.075247 S.E. of regression 0.043037 Akaike info criterion -3.389166 Sum squared resid 0.077792 Schwarz criterion 3.268722 Log likelihood 79.25623 F-statistic 46.25383 Durbin-Watson stat 2. 426073 Prob(F-statistic Inverted mA Roots 94 例2(fle: 5citypopu)用干扰模型分析中国城镇人口数(y:万人,19491~995)序列 中国城镇人口数序列明显在1978年存在一个转折点。年增加量大大增加。其原因并不 是城镇人口自身的能力增加,而是新的城镇人口管理政策使农村人口向城镇人口转移的速度 大大增加 中国城镇人口数差分序列图如下。1977年前的城镇人口年增均值是3894万人,1978 年以后的城镇人口年增均值是1028.1万人 36000 32000 1028
5 例 2 (file:5citypopu)用干扰模型分析中国城镇人口数(yt:万人,19491995)序列。 中国城镇人口数序列明显在 1978 年存在一个转折点。年增加量大大增加。其原因并不 是城镇人口自身的能力增加,而是新的城镇人口管理政策使农村人口向城镇人口转移的速度 大大增加。 中国城镇人口数差分序列图如下。1977 年前的城镇人口年增均值是 389.4 万人,1978 年以后的城镇人口年增均值是 1028.1 万人。 4000 8000 12000 16000 20000 24000 28000 32000 36000 50 55 60 65 70 75 80 85 90 95 Y -1500 -1000 -500 0 500 1000 1500 2000 50 55 60 65 70 75 80 85 90 95 DY 389.4 1028.1