自相关1:非自相关假定由第2节知回归模型的假定条件之一是,Cov(ui,u)=E(uu)=0, (i,jeT, ij),(1.1)即误差项u的取值在时间上是相互无关的。称误差项u非自相关。如果Cov(ui,u)±0, (i+j)则称误差项u存在自相关。自相关又称序列相关。原指一随机变量在时间上与其滞后项之间的相关。这里主要是指回归模型中随机误差项u与其滞后项的相关关系。自相关也是相关关系的一种。2.一阶自相关自相关按形式可分为两类。(1)一阶自回归形式当误差项u只与其滞后一期值有关时,即u,=f(ut-)+V称u具有一阶自回归形式。(2)高阶自回归形式当误差项u的本期值不仅与其前一期值有关,而且与其前若干期的值都有关系时,即u=f(ut-1, u(-2,..)+v则称u具有高阶自回归形式。通常假定误差项的自相关是线性的。因计量经济模型中自相关的最常见形式是一阶自回归形式,所以下面重点讨论误差项的线性一阶自回归形式,即(1.2)=-+V其中α是自回归系数,V是随机误差项。满足通常假设E(v)=0, 1=1,2...,TVar(v)=o2, I=1,2.., T,Cov(vi, y)=0, i+j, i,j=1,2.., T,Cov(ux-1, v)=0, 1=1, 2 ..., T,依据普通最小二乘法公式,模型(1.2)中αi的估计公式是,(p-Z--(,-2)1e2a,=(1.3)E(x, -)2Zu.21=2其中T是样本容量。若把ut,ut-看作两个变量,则它们的相关系数是Z, ( -(x, -)Q:(1.4)(r(1- /(4 -x)Vuu1=21=2(1.5)对于大样本显然有Z u,u,-1=2(=21
自相关 1. 非自相关假定 由第 2 节知回归模型的假定条件之一是, Cov(ui, uj ) = E(ui uj) = 0, (i, j ∈ T, i ≠ j), (1.1) 即误差项 ut的取值在时间上是相互无关的。称误差项 ut 非自相关。如果 Cov (ui , uj ) ≠ 0, (i ≠ j) 则称误差项 ut 存在自相关。 自相关又称序列相关。原指一随机变量在时间上与其滞后项之间的相关。这里主要是指 回归模型中随机误差项 ut 与其滞后项的相关关系。自相关也是相关关系的一种。 2.一阶自相关 自相关按形式可分为两类。 (1) 一阶自回归形式 当误差项 ut只与其滞后一期值有关时,即 ut = f (ut - 1) + vt 称 ut 具有一阶自回归形式。 (2) 高阶自回归形式 当误差项 ut的本期值不仅与其前一期值有关,而且与其前若干期的值都有关系时,即 ut = f (ut – 1, u t – 2 , . ) + vt 则称 ut 具有高阶自回归形式。 通常假定误差项的自相关是线性的。因计量经济模型中自相关的最常见形式是一阶自回 归形式,所以下面重点讨论误差项的线性一阶自回归形式,即 ut = α1 ut -1 + vt (1.2) 其中α1 是自回归系数,vt 是随机误差项。vt 满足通常假设 E(vt) = 0, t = 1, 2 ., T, Var(vt) = σv 2 , t = 1, 2 ., T, Cov(vi, vj ) = 0, i ≠ j, i, j = 1, 2 ., T, Cov(ut-1, vt) = 0, t = 1, 2 ., T, 依据普通最小二乘法公式,模型(1.2)中 α1 的估计公式是, = 1 aˆ ∑ ∑ = − = − T t t T t tt u uu 2 2 1 2 1 ( 1= ˆ β ∑ ∑ − −− 2 )( ))(( xx xxyy t tt ) (1.3) 其中 T 是样本容量。若把 ut, u t-1 看作两个变量,则它们的相关系数是 ρˆ = ∑∑ ∑ = − = = − T t t T t t T t tt uu uu 2 2 1 2 2 2 1 (r = ∑∑ ∑ = = = − − −− T t t T t t T t tt yy xx xxyy 1 2 1 2 1 )()( ))(( ) (1.4) 对于大样本显然有 ∑ ≈ (1.5) = T t ut 2 2 ∑= − T t ut 2 2 1 1
把上关系式代入(1.4)式得t=2X(1.6)a2Eu(=2因而对于总体参数有β=αi,即一阶自回归形式的自回归系数等于该二个变量的相关系数。因此原回归模型中误差项u的一阶自回归形式(见模型(1.2))可表示为,(1.7)u=pu-i+vr.p的取值范围是[-1,1]。当p>0时,称u,存在正自相关;当p<0时,称u,存在负自相关。当p=0时,称u不存在自相关。图1.1a.c,e,分别给出具有正自相关,负自相关和非自相关的三个序列。为便于理解时间序列的正负自相关特征,图1.1b.d.f分别给出图1.1ac,e,中变量对其一阶滞后变量的散点图。正负自相关以及非自相关性展现的更为明了。U(-1)102030405060708090100-202a非自相关序列图b.非自相关序列散点图X4.20-24X(-1)102030405060708090100A-2024c.正自相关序列图d.正自相关序列散点图RA2.0.-2-X(-1).602030405060708090100-2406e.负自相关序列图f.负自相关序列散点图图1.1时间序列及其散点图2
把上关系式代入(1.4)式得 ρˆ ≈ ∑ ∑ = − = − T t t T t tt u uu 2 2 1 2 1 = (1.6) 1 aˆ 因而对于总体参数有 ρ = α1,即一阶自回归形式的自回归系数等于该二个变量的相关系数。 因此原回归模型中误差项 ut 的一阶自回归形式(见模型(1.2))可表示为, ut = ρ ut-1 + vt. (1.7) ρ 的取值范围是 [-1,1]。当 ρ > 0 时,称 ut 存在正自相关;当 ρ < 0 时,称 ut 存在负自相 关。当 ρ = 0 时,称 ut 不存在自相关。图 1.1 a, c, e, 分别给出具有正自相关,负自相关和非 自相关的三个序列。为便于理解时间序列的正负自相关特征,图 1.1 b, d, f, 分别给出图 1.1 a, c, e, 中变量对其一阶滞后变量的散点图。正负自相关以及非自相关性展现的更为明了。 -3 -2 -1 0 1 2 3 10 20 30 40 50 60 70 80 90 100 U -4 -2 0 2 4 -4 -2 0 2 4 U(-1) U a. 非自相关序列图 b. 非自相关序列散点图 -4 -2 0 2 4 10 20 30 40 50 60 70 80 90 100 X -6 -4 -2 0 2 4 6 -6 -4 -2 0 2 4 6 X(-1) X c. 正自相关序列图 d. 正自相关序列散点图 -6 -4 -2 0 2 4 6 10 20 30 40 50 60 70 80 90 100 X -6 -4 -2 0 2 4 6 -6 -4 -2 0 2 4 6 X(-1) X e. 负自相关序列图 f. 负自相关序列散点图 图 1.1 时间序列及其散点图 2
下面推导当误差项u为一阶自回归形式时,u的期望、方差与协方差公式。由上式有(1.8)E(u)=E(put-+v)=pE(ur-)+E(v)因为对于平稳序列有 E(u)=E(u-1),整理上式得E()=0.(1.9)E(u):1-pVar(u)=E(u) =E(p ut-1 + y)"=E(p ut-} + v? + 2p ut-1 v)= Var(ut-1) +o,整理上式得Var(u) = 0, = 0, (1.10)1-p2Cov(ui, ut-1)= E(ut ui-1) = E(p ut-1 + v) ur-1) = p Var(ut-1)= p Var(u)= po,同理Cov(u, ut-s)= p"Var(u)=p"or2,(1.11)(s±0)令=(2...r),则由公式(1.9),(1.10),(1.11)得D207-11p1ppE(uu')=Q=02(1.12)C其中20从而验证了当回归模型的误差项u存在一阶自回归形式时,Cov(ui,u)0。同理也可证明当ut存在高阶自回归形式时,仍有Cov(ui,u)+0。注意,(1)经济问题中的自相关主要表现为正自相关(原因见3节)。(2)自相关主要针对时间序列数据。3.自相关的来源与后果误差项存在自相关,主要有如下几个原因。(1)模型的数学形式不妥。若所用的数学模型与变量间的真实关系不一致,误差项常表现出自相关。比如平均成本与产量呈抛物线关系,当用线性回归模型拟合时,误差项必存在自相关。8001000GDP600400800020060c02004004000600RESIDFDI80n2000828486&o925001002303004003
下面推导当误差项 ut 为一阶自回归形式时,ut 的期望、方差与协方差公式。由上式有 E(ut) = E(ρ ut -1 + vt) = ρ E(ut -1) + E(vt) (1.8) 因为对于平稳序列有 E(ut) = E(ut -1),整理上式得 E(ut) = ( ) 1 E vt − ρ = 0. (1.9) Var(ut) = E(ut) 2 = E(ρ ut -1 + vt) 2 = E(ρ 2 ut –1 2 + vt 2 + 2ρ ut -1 vt ) = ρ 2 Var(ut-1) +σv 2 整理上式得 Var(ut) = σu 2 = 2 2 1 σ v − ρ (1.10) Cov(ut, ut-1) = E(ut ut-1) = E((ρ ut -1 + vt) ut-1) = ρ Var(ut-1) = ρ Var(ut) = ρσu 2 同理 Cov(ut, ut-s) = ρs Var(ut) = ρs σu 2 , (s ≠ 0 ) (1.11) 令 u = (u1 u2 u3 . uT)’, 则由公式(1.9),(1.10),(1.11)得 E(u u’ ) = Ω = σu 2 (1.12) ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ −− − − − 1. . 1 . 1 . 321 2 2 1 TT T T T ρρρ ρ ρρ ρρρ 其中σu 2 = 2 2 1 σ v − ρ 。 从而验证了当回归模型的误差项 ut存在一阶自回归形式时,Cov(ui, uj) ≠ 0。同理也可 证明当 ut 存在高阶自回归形式时,仍有 Cov(ui, uj) ≠ 0。 注意,(1)经济问题中的自相关主要表现为正自相关(原因见 3 节)。(2)自相关主要 针对时间序列数据。 3. 自相关的来源与后果 误差项存在自相关,主要有如下几个原因。 (1) 模型的数学形式不妥。若所用的数学模型与变量间的真实关系不一致,误差项常表 现出自相关。比如平均成本与产量呈抛物线关系,当用线性回归模型拟合时,误差项必存在 自相关。 -800 -600 -400 -200 0 200 400 600 800 82 84 86 88 90 92 94 96 98 RESID 3
150010000401000800050006000-500-10004000-1500FDI?RESID-20008890929496n300200(2)惯性。大多数经济时间序列都存在自相关。其本期值往往受滞后值影响。突出特征就是惯性与低灵敏度。如国民生产总值,固定资产投资,国民消费,物价指数等随时间缓慢地变化,从而建立模型时导致误差项自相关。(3)回归模型中略去了带有自相关的重要解释变量。若丢掉了应该列入模型的带有自相关的重要解释变量,那么它的影响必然归并到误差项u中,从而使误差项呈现自相关。当然略去多个带有自相关的解释变量,也许因互相抵消并不使误差项呈现自相关。当误差项u存在自相关时,模型参数的最小二乘估计量具有如下特性。(1)只要假定条件Cov(X'u)=0成立,回归系数β仍具有无偏性。E(β)=E[(X'X)"X"Y]=E[(X'X)"x"(Xβ+u) ]=β+(X'X)"X"E(u)= β以一元线性回归模型,y=β+βx+u,为例E(A)-E(24-301-)= (2(-D1a(r-3)+l)-β+20-)E(c) Z(x, -x)2Z(x, -)2Z(x, -)2(2)β丧失有效性。Var(β)=E[(β-β)(β-β)]=E[(X"X)"x"uuX(X"x)"]=(XX)"X"E(uu)X(X"X)"=(X"X)"X"QX(X"X)(1.13)与2(X"X)"不等。以一元线性回归模型,y=β+βix+u,为例,当u非自相关时r(E(x,-x)u,)2Var(A)-E(-A)-E((-)-L%(Z(x, -x))2E(x, -x)?(,- (-)*+()+2() )+(1- )+)E(x, -)o.?a?+2)(,E(uus)(Z(x -x)2)2(Z(x, -x))2Z(x, -x)2当u为一阶自回归形式时2au2 (x, -X)(x, -对)Var(β)+2g.台(Z(x, -x)3)2(x, -x)24
2000 4000 6000 8000 10000 0 100 200 300 400 500 FDI GDP -2000 -1500 -1000 -500 0 500 1000 1500 82 84 86 88 90 92 94 96 98 RESID (2) 惯性。大多数经济时间序列都存在自相关。其本期值往往受滞后值影响。突出特征 就是惯性与低灵敏度。如国民生产总值,固定资产投资,国民消费,物价指数等随时间缓慢 地变化,从而建立模型时导致误差项自相关。 (3) 回归模型中略去了带有自相关的重要解释变量。若丢掉了应该列入模型的带有自相 关的重要解释变量,那么它的影响必然归并到误差项 ut 中,从而使误差项呈现自相关。当 然略去多个带有自相关的解释变量,也许因互相抵消并不使误差项呈现自相关。 当误差项 ut 存在自相关时,模型参数的最小二乘估计量具有如下特性。 (1) 只要假定条件 Cov(X ' u) = 0 成立,回归系数 β ˆ 仍具有无偏性。 E( ) = E[ (X 'X ) -1 X 'Y ] = E[ (X 'X ) -1 β X ' (X β + u) ]. ˆ = β + (X 'X) -1 X ' E(u) = β 以一元线性回归模型,yt = β0 + β1 xt + ut,为例, E( )=E( 1 ˆ β ∑ ∑ − −− 2 )( ))(( xx yyxx t tt )= E( ∑ ∑ − − +− 2 1 )( ])()[( xx uxxxx t t β t t )=β1+ ∑ ∑ − − 2 )( )()( xx uExx t t t = β1 (2) β ˆ 丧失有效性。 Var( ) = E [( - β ) ( - β )' ] = E [(X 'X ) -1 X ' u u' X (X 'X) -1 β ] ˆ β ˆ β ˆ = (X ' X) -1 X ' E (u u') X (X ' X ) -1= (X 'X ) -1 X ' Ω X (X ' X ) -1 (1.13) 与 (X ' X ) σ2 -1 不等。 以一元线性回归模型,yt = β0 + β1 xt + ut,为例,当 ut 非自相关时 Var ( ) = E( -β1) 2 = E( 1 ˆ β 1 ˆ β ∑ ∑ − − 2 )( )( xx uxx t tt ) 2 = E[ ∑ ∑ − − 22 2 ))(( ))(( xx uxx t tt ] = ∑ − 22 ))(( 1 xxt E{ (x1- x ) 2 u1 2 +(x2- x ) 2 u2 2 +.+2[(x1- x )(x2- x )u1u2+(x1- x )(x3- x )u1u3+.]} = ∑ ∑ − − 22 2 2 ))(( )( xx xx t t σ u +2∑< ∑ − − − st t t s xx xxxx 22 ))(( ))(( E(ut us) = ∑ − 2 2 xx )( t σ u 当 ut 为一阶自回归形式时 Var ( 1 ) = ˆ β ∑ − 2 2 xx )( t σ u +2 2 σ u ∑< ∑ − − − st t t s xx xxxx 22 ))(( ))(( ρ s-t 4
Oβ,的方差比u非自相关时大,失去有效性。因为OLS法仍然用估计β的Z(x, -3)?方差,而兴一),一项常常是正的,所以会低估序的方差。Ks((x, -x))2B低估回归参数估计量的方差,等于夸大了回归参数的抽样精度(t1/ /Z(x, -)2过高的估计统计量1的值,从而把不重要的解释变量保留在模型里,使显著性检验失去意义。(3)有可能低估误差项u的方差。(4)Var(B阝)和s2都变大,都不具有最小方差性。所以用依据普通最小二乘法得到的回归方程去预测,预测是无效的。4.自相关检验下面介绍三种判别与检验方法。(1)图示法图示法就是依据残差u,对时间1的序列图作出判断。由于残差ü,是对误差项u的估计,所以尽管误差项u观测不到,但可以通过ü的变化判断u是否存在自相关。图示法的具体步骤是,(1)用给定的样本估计回归模型,计算残差i,,(t=1,2,..T),绘制残差图;(2)分析残差图。若残差图与图1.1a类似,则说明ut不存在自相关;若与图1.1c类似,则说明u存在正自相关;若与图1.1e类似,则说明u存在负自相关。经济变量由于存在惯性,不可能表现出如图1.1e那样的震荡式变化。其变化形式常与图1.1中a相类似,所以经济变量的变化常表现为正自相关。(2)DW(Durbin-Watson)检验法DW检验是J.Durbin,GS.Watson于1950,1951年提出的。它是利用残差u,构成的统计量推断误差项u是否存在自相关。使用DW检验,应首先满足如下三个条件。(1)误差项u,的自相关为一阶自回归形式。(2)因变量的滞后值y-不能在回归模型中作解释变量。(3)样本容量应充分大(T>15)DW检验步骤如下。给出假设Ho:p=0(ut不存在自相关)Hi:p0(u存在一阶自相关)用残差值u,计算统计量DW。YZ(i, -it1)2DW=-2(1.14)Za?1=1其中分子是残差的一阶差分平方和,分母是残差平方和。把上式展开,5
1 ˆ β 的方差比 ut非自相关时大,失去有效性。因为 OLS 法仍然用 ∑ − 2 2 xx )( t σ u 估计 的 方差,而 1 ˆ β ∑< ∑ − −− st t t s xx xxxx 22 ))(( ))(( 项常常是正的,所以会低估 的方差。 1 ˆ β 低估回归参数估计量的方差,等于夸大了回归参数的抽样精度(t = ∑ − 2 1 ˆ )( ˆ xx σ t β ), 过高的估计统计量 t 的值,从而把不重要的解释变量保留在模型里,使显著性检验失去意义。 (3) 有可能低估误差项 ut的方差。 (4) Var( ) 和 su 2都变大,都不具有最小方差性。所以用依据普通最小二乘法得到的回 归方程去预测,预测是无效的。 1 ˆ β 4. 自相关检验 下面介绍三种判别与检验方法。 (1) 图示法 图示法就是依据残差 对时间 t 的序列图作出判断。由于残差 是对误差项 ut 的估计, 所以尽管误差项 ut 观测不到,但可以通过 的变化判断 ut 是否存在自相关。 ut ˆ ut ˆ ut ˆ 图示法的具体步骤是,(1) 用给定的样本估计回归模型,计算残差 , (t = 1, 2, . T), 绘制残差图;(2) 分析残差图。若残差图与图 1.1 a 类似,则说明 ut 不存在自相关;若与图 1.1 c 类似,则说明 ut 存在正自相关;若与图 1.1 e 类似,则说明 ut 存在负自相关。 ut ˆ 经济变量由于存在惯性,不可能表现出如图 1.1 e 那样的震荡式变化。其变化形式常与 图 1.1 中 a 相类似,所以经济变量的变化常表现为正自相关。 (2) DW(Durbin-Watson)检验法 DW 检验是 J. Durbin, G. S. Watson 于 1950,1951 年提出的。它是利用残差 构成的统 计量推断误差项 ut 是否存在自相关。使用 DW 检验,应首先满足如下三个条件。 ut ˆ (1) 误差项 ut 的自相关为一阶自回归形式。 (2) 因变量的滞后值 yt-1不能在回归模型中作解释变量。 (3) 样本容量应充分大(T > 15) DW 检验步骤如下。给出假设 H0: ρ = 0 (ut 不存在自相关) H1: ρ ≠ 0 (ut 存在一阶自相关) 用残差值 计算统计量 uˆt DW。 DW = ∑ ∑ = = − − T t t T t tt u uu 1 2 2 2 1 ˆ ( ˆˆ ) (1.14) 其中分子是残差的一阶差分平方和,分母是残差平方和。把上式展开, 5