§6.2多重共线性对回归模型的影响 在例3.3中,我们建立的中国民航客运量回归方程为: y=450.9+0.354x1-0.561x2-0.0073x3+21.578x4+0.435x5 其中:y民航客运量(万人) x1一国民收入(亿元),x2一消费额(亿元, x3铁路客运量(万人),x民航航线里程(万公里 xs来华旅游入境人数(万人) 5个自变量都通过了t检验,但是x2的回归系数是负值,x2 是消费额,从经济学的定性分析看,消费额与民航客运量应 该是正相关,负的回归系数无法解释。问题出在哪里?这正 是由于自变量之间的复共线性造成的
§6.2 多重共线性对回归模型的影响 在例3.3中,我们建立的中国民航客运量回归方程为: =450.9+0.354x1-0.561x2-0.0073x3+21.578x4+0.435x5 其中:y—民航客运量(万人), x1—国民收入(亿元), x2—消费额(亿元), x3—铁路客运量(万人), x4—民航航线里程(万公里), x5—来华旅游入境人数(万人)。 5个自变量都通过了t检验,但是x2的回归系数是负值,x2 是消费额,从经济学的定性分析看,消费额与民航客运量应 该是正相关,负的回归系数无法解释。问题出在哪里?这正 是由于自变量之间的复共线性造成的。 y ˆ
§6.3多重共线性的诊断 方差扩大因子法 对白变量做中心标准化,则XX=(r1)为自变量的相关阵。 C=(c;)=(XX) (65) 称其主对角线元素ⅤF=C1为自变量x的方差扩大因子( ariance Inflation factor,简记为VIF)。根据(3.31)式可知, var(B)=c, olLi j=l,,,p 其中L是x的离差平方和,由(6.6)式可知用c;做为衡量 自变量x的方差扩大程度的因子是恰如其分的
§6.3 多重共线性的诊断 一、方差扩大因子法 对自变量做中心标准化,则X* ′X* =(rij)为自变量的相关阵。 记 C=(cij)=(X* ′X* ) -1 (6.5) 称其主对角线元素VIFj=cjj为自变量xj的方差扩大因子(Variance Inflation Factor,简记为VIF)。根据(3.31)式可知, j ) cj j / Lj j , j 1, , p ˆ var( = 2 = 其中Ljj是xj的离差平方和,由(6.6)式可知用cjj做为衡量 自变量xj的方差扩大程度的因子是恰如其分的
§6.3多重共线性的诊断 记R2为自变量x对其余p1个自变量的复判定系数, 可以证明 (6.7) J 1-R (67)式同样也可以作为为方差扩大因子VF1的定义, 由此可知VF1≥1
§6.3 多重共线性的诊断 记 2 R j 为自变量xj对其余p-1 个自变量的复判定系数, 可以证明 2 1 1 j jj R c − = (6.7) (6.7)式同样也可以作为为方差扩大因子VIFj的定义, 由此可知VIFj≥1
§6.3多重共线性的诊断 Coefficients a Stand ar dized Unstandardized Coeffici Collinearity Coefficients Statistics Std Tolera Beta nce VIF ( Constant)450.909178078 2.532 030 1 08524474.152.002.0011963 2 -.561 125-24854478 0011741 X3 -7E03 002 083-3.510 006 315|3.171 X4 21.578 4.030 5315354 000 018555 X5 435 052 5648440.000.04025.2 a Dependent Variable: Y
§6.3 多重共线性的诊断 Coefficients a 450.909 178.078 2.532 .030 .354 .085 2.447 4.152 .002 .001 1963 -.561 .125 -2.485 -4.478 .001 .001 1741 -7.E-03 .002 -.083 -3.510 .006 .315 3.171 21.578 4.030 .531 5.354 .000 .018 55.5 .435 .052 .564 8.440 .000 .040 25.2 (Constant) X 1 X 2 X 3 X 4 X 5 B Std. Error Unstandardized Coefficients Beta Standar dized Coeffici ents t Sig. Tolera nce VIF Collinearity Statistics a. Dependent Variable: Y