第3讲回归与ARMA组合模型 已经学习回归模型和时间序列模型,如果把这两种分析方法结合在一起,有时会得到比 其中任何一种方法都好的预测结果。 例如有如下回归模型 =Bo+Bi 其中x是解释变量,y是被解释变量,ψ是随机误差项。上述模型的估计式是 Bo+B,xr+u 令=0,用上式可预测y的值。L,是一个平稳的、非自相关的残差序列。当,存在自相关 时,时间序列分析的一个有效应用是对残差序列l,建立ARMA模型。然后将上式中的残差 项用ARMA模型替换。在利用上述模型预测y时,可以利用ARMA模型先预测出的值 有时,这会使y的预测值更准确 这种回归与时间序列相结合的模型形式是 y-Bo+B,x+a-(L)O(L)vr (2) 其中1=(LO(L)v,或写成中(L)1=已(Lvov是服从正态分布的、非自相关的误差 项。v的方差一般与,不一样。这种回归与时间序列相组合的模型称作转(变)换函数模型 ( transfer function model),多元(变量)自回归移动平均模型( multivariate autoregressive moving average model),简称 MARMA模型,或回归与时间序列组合模型( combined regression-time series model 假设(1)式中的t是一个ARMA(1,1)过程,则估计(1)式的 EViews估计命令是 ⅹAR(1)MA(1) 注意 (1)如果(1)式中的t是一个AR(1)过程,则回归与ARMA组合模型表达的就是误 差项为一阶自相关的经典回归模型 (2)以(2)式为例,按wold分解定理,也可以对转换函数模型作如下理解。y-B x=表示在y中剔除了确定性影响角+Bx后所得序列是一个不含任何确定性成分的 平稳的随机序列。用山建立时间序列模型。 回归与ARMA组合模型也可以由被解释变量及其滞后项、一个或多个解释变量及其滞 后项、和描述随机误差序列的时间系列模型3部分组成 只含有一个解释变量的组合模型可写为, A(D)y=yo+rd+B(L)x,+e() vi (3) 其中=φ(L)θ(Lv。)表示常数(漂移项)。d表示y的线性确定性成分,如周期性成 分、时间t的多项式和指数形式,虚拟变量等,可以直接用t预测。通过对特征多项式A(L) B(L)、Φ(L)、O(L)的约束可以得到组合模型的不同特殊形式。整理如表1。 站在回归模型基础上看组合模型(3),是通过把模型误差项拟合成ARMA形式从而提 高回归系数a,房的有效性。 站在时间序列模型基础上看组合模型(3),是把解释变量B(Lx;看作υ中的确定性成分, 通过回归,把这些确定性成分从y中减掉,从而对一个平稳误差序列建立ARMA模型。 通过对组合模型的施加约束条件可以得到各种形式的模型
1 第 3 讲 回归与 ARMA 组合模型 已经学习回归模型和时间序列模型,如果把这两种分析方法结合在一起,有时会得到比 其中任何一种方法都好的预测结果。 例如有如下回归模型 yt = 0 + 1 xt + ut (1) 其中 xt是解释变量,yt是被解释变量,ut是随机误差项。上述模型的估计式是 yt = 0ˆ + 1ˆ xt + t uˆ 令 t uˆ = 0,用上式可预测 yt的值。 t uˆ 是一个平稳的、非自相关的残差序列。当 t uˆ 存在自相关 时,时间序列分析的一个有效应用是对残差序列 t uˆ 建立 ARMA 模型。然后将上式中的残差 项用 ARMA 模型替换。在利用上述模型预测 yt时,可以利用 ARMA 模型先预测出 t uˆ 的值。 有时,这会使 yt的预测值更准确。 这种回归与时间序列相结合的模型形式是 yt = 0ˆ + 1ˆ xt + -1(L) (L) vt (2) 其中 t uˆ = -1(L) (L) vt,或写成 (L) t uˆ = (L) vt。vt 是服从正态分布的、非自相关的误差 项。vt的方差一般与 t uˆ 不一样。这种回归与时间序列相组合的模型称作转(变)换函数模型 (transfer function model),多元(变量)自回归移动平均模型(multivariate autoregressive -moving average model),简称 MARMA 模型,或回归与时间序列组合模型(combined regression-time series model)。 假设(1)式中的 ut是一个 ARMA(1, 1)过程,则估计(1)式的 EViews 估计命令是 Y c X AR(1) MA(1) 注意: (1)如果(1)式中的 ut是一个 AR(1) 过程,则回归与 ARMA 组合模型表达的就是误 差项为一阶自相关的经典回归模型。 (2)以(2)式为例,按 Wold 分解定理,也可以对转换函数模型作如下理解。yt - 0 - 1 xt = ut 表示在 yt 中剔除了确定性影响0 +1 xt 后所得序列 ut 是一个不含任何确定性成分的 平稳的随机序列。用 ut建立时间序列模型。 回归与 ARMA 组合模型也可以由被解释变量及其滞后项、一个或多个解释变量及其滞 后项、和描述随机误差序列的时间系列模型 3 部分组成。 只含有一个解释变量的组合模型可写为, A(L) yt = 0 + dt +B(L) xt + ( ) ( ) L L vt (3) 其中 ut =-1(L) (L) vt。0 表示常数(漂移项)。dt 表示 yt的线性确定性成分,如周期性成 分、时间 t 的多项式和指数形式,虚拟变量等,可以直接用 t 预测。通过对特征多项式 A(L)、 B(L)、 (L)、 (L)的约束可以得到组合模型的不同特殊形式。整理如表 1。 站在回归模型基础上看组合模型(3),是通过把模型误差项拟合成 ARMA 形式从而提 高回归系数j,j的有效性。 站在时间序列模型基础上看组合模型(3),是把解释变量 B(L)xt看作 yt中的确定性成分, 通过回归,把这些确定性成分从 yt中减掉,从而对一个平稳误差序列建立 ARMA 模型。 通过对组合模型的施加约束条件可以得到各种形式的模型
表1 组合模型及其各种特殊形式 名称 模型形式 约束条件 组合模型(一般形式) +r+ B()xr 6(L) Φ(L) 分布滞后模型 0+xd, +B(L)x,+v A(L)=6(D=d(L=1 动态分布滞后模型 A(L)y=№+B(L)x+v (D)=(D=1,y=0 自回归(AR)模型 A(D)n=20+ve B(D)=0,(D=d(D=1,r0 移动平均(MA)模型 y=D+eL)v A(D=1,B(L=0,(D)=1,y 自回归移动平均(ARMA)模型A(L)y=为+6D)v B(L=0,d(L=1 ARMA误差项的分布滞后模型 线性回归模型 =0+%+6x+v A(L)=B(D)=6(L)=d(D=1 注:为表示常数(截距项)。d表示y的线性确定性成分,如周期性成分、时间t的多项式和指数形式, 虚拟变量等,可以直接用时间t预测。A(L)、BL)、O(D)、Φ(L)是特征多项式,B(L)的第1项是角,不必为 回归模型和ARMA模型都包括在组合模型之中。他们只不过是组合模型的一个特殊形 式 进一步分析发现,回归与ARMA组合模型实际上是动态分布滞后模型的一种表现形式。 假定有如下组合模型, +B1x+ (2) v2~IN(0,a2) 用滞后算子形式改写(2)式 (1-L)a=v 中1L 把上式代入(1)式, =B+B1x1+ P,L 上式两侧同乘(1-L,得 (1-L)y=(1-D负+B1(1-91L)x+v =+(1-)B为+B1x-Bx1+v 可见如果回归模型误差项是1阶自回归形式。实际上y是一个一阶自回归分布滞后模 型,只不过对x1的系数多加了一个约束条件。若x1的系数用表示,则约束条件是, B2=-B1pu 以组合模型一般形式 A(D)y =%+rd, +B(L)x,+e() vi
2 表 1 组合模型及其各种特殊形式 名称 模型形式 约束条件 组合模型(一般形式) A(L) yt = 0 +dt + B(L) xt + ( ) ( ) L L vt 无 分布滞后模型 yt = 0 +dt +B(L) xt + vt A(L) = (L) = (L) = 1 动态分布滞后模型 A(L) yt = 0 +B(L) xt + vt (L) = (L) = 1,=0 自回归(AR)模型 A(L) yt = 0 +vt B(L) =0, (L) = (L) = 1,=0 移动平均(MA)模型 yt = 0 +(L) vt A(L) =1,B(L)=0, (L) = 1,=0 自回归移动平均(ARMA)模型 A(L) yt = 0 +(L) vt B(L)=0, (L) = 1,=0 ARMA 误差项的分布滞后模型 yt =0 +B(L) xt + ( ) ( ) L L vt A(L) =1,=0 线性回归模型 yt = 0 +dt +0 xt + vt A(L) = B(L) = (L) = (L) = 1 注:0 表示常数(截距项)。dt 表示 yt 的线性确定性成分,如周期性成分、时间 t 的多项式和指数形式, 虚拟变量等,可以直接用时间 t 预测。A(L)、B(L)、 (L)、 (L)是特征多项式,B(L)的第 1 项是0,不必为 1。 回归模型和 ARMA 模型都包括在组合模型之中。他们只不过是组合模型的一个特殊形 式。 进一步分析发现,回归与 ARMA 组合模型实际上是动态分布滞后模型的一种表现形式。 假定有如下组合模型, yt = 0 + 1 xt + ut (1) ut = 1ut-1 + vt (2) vt IN(0, 2) 用滞后算子形式改写(2)式, (1-1L) ut = vt ut = 1 1L 1 vt 把上式代入(1)式, yt = 0 + 1 xt + 1 1L 1 vt (3) 上式两侧同乘(1-1L),得 (1-1L) yt = (1-1L) 0 + 1 (1-1L) xt +vt yt = 1 yt-1 + (1-1) 0 + 1 xt -11 xt-1 +vt 可见如果回归模型误差项是 1 阶自回归形式。实际上 yt 是一个一阶自回归分布滞后模 型,只不过对 xt-1的系数多加了一个约束条件。若 xt-1的系数用2表示,则约束条件是, 2 = -11 以组合模型一般形式 A(L) yt = 0 + dt +B(L) xt + ( ) ( ) L L vt
为例,可变换为, A (L)d()y=0()+rd ()B()o()x +O(L)v, 如果A(L阶数为n,B(L)阶数为m,Φ(L阶数为p,那么一般组合模型(4)实际上是一个 带有确定性成分的ADL(n+pm+p)模型。 组合模型主要有三种用处。(1)克服回归模型中的自相关:(2)对序列做长期预测 应用1:用组合模型克服回归模型中的自相关。 【案例1】(fle:5 autos7,5 autos7b)中国储蓄存款总额(DEPO,亿元,1960-2001) 储蓄存款年增加额(储蓄存款余额序列的差分序列)(Y,亿元,1970-2006)对GDP(亿元) 的计量经济模型 包括两项内容:(1)储蓄存款年底余额对GDP的计量经济分析(总量对增量):(2)储 蓄存款年増加额(储蓄存款余额序列的差分序列)对GDP的计量经济分析(増量对增量)。 从分析方法上包括如下内容:作图分析;边际系数分析,弹性系数分析:线性模型分析 非线性模型分析:回归模型分析,组合模型分析:估计方法上包括OLS估计,WLS估计, 估计 见下图分析储蓄存款年底余额与GDP的比率序列( DEPO/GDP,1970-2006)。 DEPO/GDP 先回忆用广义差分的方法克服自相关。用Y对GDP回归(eq03) DEPO1=-3028.56+0.6975GDP (-46)(36.6) R=0.97,D∥=0.18,T=42,(1960-2001) 残差图如下 Residual Actual- Fitted 15000 40000 0000 20000 5000 20000 图1线性模型的拟合与残差图
3 为例,可变换为, A(L) (L) yt = 0 (L) + dt (L)+B(L) (L) xt + (L)vt 如果 A(L)阶数为 n,B(L) 阶数为 m, (L)阶数为 p,那么一般组合模型(4)实际上是一个 带有确定性成分的 ADL(n+p,m+p) 模型。 组合模型主要有三种用处。(1)克服回归模型中的自相关;(2)对序列做长期预测; 应用 1:用组合模型克服回归模型中的自相关。 【案例 1】(file: 5autoco7, 5autoco7b)中国储蓄存款总额(DEPO,亿元,1960-2001)、 储蓄存款年增加额(储蓄存款余额序列的差分序列)(Y,亿元,1970-2006)对 GDP(亿元) 的计量经济模型。 包括两项内容:(1)储蓄存款年底余额对GDP的计量经济分析(总量对增量);(2)储 蓄存款年增加额(储蓄存款余额序列的差分序列)对GDP的计量经济分析(增量对增量)。 从分析方法上包括如下内容:作图分析;边际系数分析,弹性系数分析;线性模型分析, 非线性模型分析;回归模型分析,组合模型分析;估计方法上包括OLS估计,WLS估计, ML估计。 见下图分析储蓄存款年底余额与GDP的比率序列(DEPO/GDP,1970-2006)。 .0 .1 .2 .3 .4 .5 .6 .7 .8 .9 60 65 70 75 80 85 90 95 00 DEPO/GDP 0 10000 20000 30000 40000 50000 60000 70000 80000 0 10000 30000 50000 70000 90000 GDP Y 先回忆用广义差分的方法克服自相关。用 Yt对 GDPt回归(eq03), DEPOt = -3028.56 + 0.6975 GDPt (5) (-4.6) (36.6) R 2 = 0.97, DW=0.18, T = 42, (1960-2001) 残差图如下, -10000 -5000 0 5000 10000 15000 -20000 0 20000 40000 60000 80000 1960 1965 1970 1975 1980 1985 1990 1995 2000 Residual Actual Fitted 图 1 线性模型的拟合与残差图
Breusch-Godfrey Serial Correlation LM Test F-statistic 174.5373 Probability 00o Obs"R-squared 37. 87676 Probability 0000000 (2阶自相关的LM检验结果,存在自相关 White Heteroskedasticity Test F-statistic 19.78057 Probability Obs*R-squared 21.15000 Probability 000026 (无交叉项Whte异方差检验结果,存在异方差。) 由图1、2阶自相关的LM检验结果和Whte异方差检验结果可以看出模型既存在自相 关又存在异方差。 下面尝试建立对数线性模型。(eq01) LnDEPO, =-88685+1.7647 LnGDP, (6) (-389)(696)R2=0.99,DW=0.23,T=42,(1960-2001) Actual Fitted 075808.59.09.5100105110115120 196019651970197519801985199019952000 图2对数线性模型的拟合与残差图 Breusch-Godfrey Serial Correlation LM Test F-stati 76 39188 Probability 00000 Obs"R-squared 33.63451 Probabilit (2阶自相关的LM检验结果,存在自相关) White Heteroskedasticity Test F-statistic 3240260Prob.F239) 0049907 Obs*R-squared 5.984581 Prob Chi-Square (2) 0.050172 (无交叉项Whte异方差检验结果,不存在异方差。) 由图2、2阶自相关的LM检验结果和 White异方差检验结果可以看出对数模型仍然存 在自相关,但不存在异方差 用模型的残差序列做2阶自回归,结果如下, RES1=-0.0094+1.18RES1-0.36RES2 (7) (-0.6)(8.0)(-2.4) R2=0.81,DW=1.65,7=40,(19622001)
4 (2 阶自相关的 LM 检验结果,存在自相关。) (无交叉项 White 异方差检验结果,存在异方差。) 由图 1、2 阶自相关的 LM 检验结果和 White 异方差检验结果可以看出模型既存在自相 关又存在异方差。 下面尝试建立对数线性模型。(eq01) LnDEPOt = -8.8685 +1.7647 LnGDPt (6) (-38.9) (69.6) R 2 = 0.99, DW=0.23, T = 42, (1960-2001) 3 4 5 6 7 8 9 10 11 12 7.0 7.5 8.0 8.5 9.0 9.5 10.0 10.5 11.0 11.5 12.0 LOG(GDP) LOG(Y) -.4 -.2 .0 .2 .4 .6 2 4 6 8 10 12 1960 1965 1970 1975 1980 1985 1990 1995 2000 Residual Actual Fitted 图 2 对数线性模型的拟合与残差图 (2 阶自相关的 LM 检验结果,存在自相关) (无交叉项 White 异方差检验结果,不存在异方差。) 由图 2、2 阶自相关的 LM 检验结果和 White 异方差检验结果可以看出对数模型仍然存 在自相关,但不存在异方差。 用模型的残差序列做 2 阶自回归,结果如下, RESt = -0.0094 +1.18 RESt-1 -0.36 RESt-2 (7) (-0.6) (8.0) (-2.4) R 2 = 0.81, DW=1.65, T = 40, (1962-2001)
模型残差中存在2阶自相关形式 先回忆用广义差分方法克服自相关 克服自相关方法(1):采取2阶广义差分变量回归,估计参数。定义2个广义差分变量 如下: GLnY,= LnY-1 18 LnY -1+0.36 Ln Y+-2 (8) GLnGDP,=LnGDP,-1. 18 LnGDP,-+0.36 LnGDP:-2 得估计结果。 GLnY,=-15820+1.7505 GLnGDP, (-15.8)(295) R=0.96,D=1.64,T=40,(1962-2001) 做异方差和自相关检验如下。 Breusch-Godfrey Serial Correlation LM Test F-statis 0743307Prob.F(137 0.394157 Obs*R-squared 0787749Prob. Chi-Square(1)0.374782 (1阶自相关LM检验结果) Breusch-Godfrey Serial Correlation LM Test F-statistic 1.077537 Probability 0.351159 Obs"R-squared 2.259280 Probabilit 0.32315 (2阶自相关LM检验结果) White Heteroskedasticity Test F-statistic 1.397597 Probability 0.259935 Obs"R-squared 2.809580 Probability 0.245419 (无交叉项Whte异方差检验结果) 19651970197519801985199019952000 观测值、拟合值、残差 模型符合要求。储蓄存款总额(Y,亿元)对GDP的弹性是1.75。即GDP每增长1%, 储蓄存款总额增长1.75%。 克服自相关方法(2):用回归与ARMA的组合模型克服自相关估计回归参数 观察(6)式的残差序列的相关图、偏相关图。应该是2阶自回归过程,(7)也证明了 这一结论
5 模型残差中存在 2 阶自相关形式。 先回忆用广义差分方法克服自相关。 克服自相关方法(1):采取 2 阶广义差分变量回归,估计参数。定义 2 个广义差分变量 如下: GLnYt = LnYt-1.18 LnYt-1+0.36 Ln Yt-2 (8) GLnGDPt = LnGDPt-1.18 LnGDPt-1+0.36 LnGDPt-2 (9) 得估计结果。 GLnYt = -1.5820+1.7505 GLnGDPt (10) (-15.8) (29.5) R 2 = 0.96, DW=1.64, T = 40, (1962-2001) 做异方差和自相关检验如下。 (1 阶自相关 LM 检验结果) (2 阶自相关 LM 检验结果) (无交叉项 White 异方差检验结果) -.3 -.2 -.1 .0 .1 .2 0.4 0.8 1.2 1.6 2.0 2.4 1965 1970 1975 1980 1985 1990 1995 2000 Residual Actual Fitted 观测值、拟合值、残差 模型符合要求。储蓄存款总额(Y,亿元)对 GDP 的弹性是 1.75。即 GDP 每增长 1%, 储蓄存款总额增长 1.75%。 克服自相关方法(2):用回归与 ARMA 的组合模型克服自相关估计回归参数。 观察(6)式的残差序列的相关图、偏相关图。应该是 2 阶自回归过程,(7)也证明了 这一结论