第二节多重共线性( multi-collinearity) 如果假定10不成立,即在解释变量X1,X2,…,Ⅹ中,存在线性关系 解释变量间的确定线系关系存在时,存在不全为零的常数λ1,2,…孔,使 入1X1+22X2 设1<>0,则 X1=X+3X3+ 这种关系为完全多重共线性,变量间的相关系数为1。实际上更多的情 况是,解释变量间有不完全的线性关系:存在不全为零的数:,2…,使 A1X1+入2X21+…AkX+v1=0 假定λ1>0 X,;+3X2+ 入1 了 其中ⅴ为随机项。我们把这种解释变量间存在的完全或不完全的线性关系 称为多重共线性。由于经济变量自身的性质,它们之间这种多重共线性或 强或弱,普遍存在的
第二节 多重共线性(multi-collinearity) 如果假定10不成立,即在解释变量X1,X2,…,Xk中,存在线性关系。 解释变量间的确定线系关系存在时,存在不全为零的常数 1 X1i + 2 X2i +k Xki = 0 1 ,2 , k,使 ki k X i X i X i X 1 3 1 3 2 1 2 1 1 0, = + + 设 则 这种关系为完全多重共线性,变量间的相关系数为1。实际上更多的情 况是,解释变量间有不完全的线性关系:存在不全为零的数: 1 X1i + 2 X2i +k Xki + vi = 0 1 ,2 , k,使 其中vi 为随机项。我们把这种解释变量间存在的完全或不完全的线性关系 称为多重共线性。由于经济变量自身的性质,它们之间这种多重共线性或 强或弱,普遍存在的。 1 1 3 1 3 2 1 2 1 i ki k i i i v X = X + X + X + 假定λ1<>0
第三节多重共线性的影响 完全多重共线性 以两个解释变量的回归模型为例,假定回归模型为: 1+B2X2+B3X3+ 如果采用OLS估计,则有: B1=Y-B2X2-B33 mIn ∑2=2(y-A-B2X2-BX3)2 ∑(y-/2x2-B3x3)2 根据最小平方和原则,并求解正规方程组,可得到 ∑yx2)∑x2,)-∑yx3)∑ Xiii x2,)(>x2) 2i-3i ∑x2)∑x2)-(∑nx2)∑ B 2t+3t ∑x2,)∑x2)-C∑x2x3)2
第三节 多重共线性的影响 一、完全多重共线性 以两个解释变量的回归模型为例,假定回归模型为: Yi = 1 + 2 X2 + 3 X3 +ui 如果采用OLS估计,则有: 2 2 2 3 3 2 1 2 2 3 3 2 1 2 2 3 3 ) ˆ ˆ ( ) ˆ ˆ ˆ min ˆ ( ˆ ˆ ˆ y x x u Y X X Y X X i i i = − − = − − − = − − 根据最小平方和原则,并求解正规方程组,可得到: 2 2 3 2 2 3 2 3 2 2 2 ( )( ) ( ) ( )( ) ( )( ) ˆ 2 3 3 − − = i i i i i i i i x x x x y x x y x x x i i i 2 2 3 2 2 2 2 3 2 2 3 ( )( ) ( ) ( )( ) ( )( ) ˆ 2 3 2 − − = i i i i i i i i x x x x y x x y x x x i i i
如果Ⅹ2与X3存在完全共线性,即x2=Ax3则: ∑yx21)∑x2)-(∑yx)∑x2x3;) ∑x 2 D.X 2 3 (∑yx3)∑x2)-C∑yx3)(∑x2) (花2∑ DI )∑x2)-(∑x2) 0 此时,B2是不确定的。同样也是不确定的。而方差 Var(B,) ∑ ∑x∑x2-∑x2x3 在x2=x时,Var(B2) 因此,存在完全共线性时,不能利用OLS估计参数,参数的方差变为无 限大
0 0 ( )( ) ( ) ( )( ) ( )( ) ( )( ) ( ) ( )( ) ( )( ) ˆ 2 2 3 2 2 2 2 3 2 3 2 2 3 2 2 3 2 3 2 2 2 3 3 3 3 2 3 3 = − − = − − = i i i i i i i i i i i i i x x x y x x y x x x x x x y x x y x x x i i i i i i i 如果X2与X3存在完全共线性,即 x2 = x3 则: 因此,存在完全共线性时,不能利用OLS估计参数,参数的方差变为无 限大。 = − = = − = 2 2 2 2 2 3 2 2 3 2 2 3 2 2 2 3 2 3 2 2 2 2 2 2 3 3 ) ˆ ( ) ˆ ( ˆ ˆ ( ) ( ) 在 时, ( ) 此时, 是不确定的。同样 也是不确定的。而方差 i x x x x x Var x x x x x Var i i i i i i i
二、不完全多重共线性 假定Ⅹ2,Ⅹ3间存在不完全多重共线性,以离差形式表示为x2=Ax3+ 其中v;为随机项。则 B_2y,331 +v 1(-*3 )2(x3 +v )x, 1 x2:+v x2;+1.)x 式中分母可化简为∑x2)∑v2)<0 此时,B2是可估计的的。同样β3也是可估计的。而方 Var(B,) ∑ 2 3i 2i 2i-3i ∑ ∑ 2i-3i (∑x2∑x2,) ∑x{1-n23)
二、不完全多重共线性 假定X2,X3 间存在不完全多重共线性,以离差形式表示为: 。 其中vi 为随机项。则 i x = x + v 2 3 式中分母可化简为( )( ) 0。 [ ( ) ]( ) [ ( ) ] [ ( )]( ) ( )[ ( ) ] ˆ 2 2 2 3 3 2 2 3 3 3 3 2 3 2 3 3 3 + − + + − + = i i i i i i i i i i i i i i x v x v x x v x y x v x y x x v x i i i − = − = − = − = {1 ) [1 /( )] / ) ˆ ( ˆ ˆ 2 3 2 3 2 2 2 2 2 2 3 2 3 2 2 2 2 3 2 3 2 2 3 2 3 2 2 2 2 2 2 3 x r x x x x x x x x x x x x x x Var i i i i i i i i i i i i i i i ( ) ( ) ( ) 此时, 是可估计的的。同样 也是可估计的。而方差
F(B2)= 23 显然,当解释变量X2、ⅹ3之间的相关系数r23的绝对值越大,共线性程 度就越高,参数估计值的方差就越大,越不准确,且随着相关系数的增大, 方差以更大的幅度增加。 多重共线性的影响 (1)参数估计值的方差增大,估计量的精度大大降低。影响预测结果(准 确度和置信区间) (2)参数估计值的标准差增大,使的t检验值变小,增大了接受H,舍弃 对因变量有显著影响的变量。 (3)尽管t检验不显著,但是R2仍可能非常高。 (4)OLS估计量对观测值的轻微变化相当敏感。 第三节多重共线性的探査和解决 、多重共线性的探查 由于多重共线性使一种普遍现象,而多重共线性的程度影响了参数估 计结果,因此我们关心的是共线性的程度,而不是共线性是否存在
− = (1 ) ) ˆ ( 2 2 3 2 2 3 x r Var i 显然,当解释变量X2、X3之间的相关系数 r23 的绝对值越大,共线性程 度就越高,参数估计值的方差就越大,越不准确,且随着相关系数的增大, 方差以更大的幅度增加。 三、多重共线性的影响 (1)参数估计值的方差增大,估计量的精度大大降低。影响预测结果(准 确度和置信区间)。 (2)参数估计值的标准差增大,使的t 检验值变小,增大了接受H0,舍弃 对因变量有显著影响的变量。 (3)尽管t 检验不显著,但是R2仍可能非常高。 (4)OLS估计量对观测值的轻微变化相当敏感。 一、多重共线性的探查 由于多重共线性使一种普遍现象,而多重共线性的程度影响了参数估 计结果,因此我们关心的是共线性的程度,而不是共线性是否存在。 第三节 多重共线性的探查和解决