只需证明Z(x-x)u=Zxu-Zxi=Zxu-Zx(-o-x)=0。上式为正规方程之一。(5)Cov(ut,y,)=0只需证明(-)=,-=Z,=i+x)= βZu+pZux=05.y的分布和β,的分布根据假定条件ut~N(0,2),E(y)=E(Bo+ βix+ u)=Bo+ βix,+ E(u)=Bo+ βixroVar(y) = Var (Bo + βi x, + u) = Var (Bo + βi x.) + Var (u) = ?y,是u,的线性函数,所以Jf~ N(βo+ βix, 2 )。可以证明1E(β)=β,Var(β)=a2Z(x, -x)2β是y的线性函数(β=Zky),所以1βI~N(βI,0)Z(x, -x)26.的估计定义62= (Zu,)/(T-2)其中2表示待估参数的个数。可以证明E(2)=2。2是的无偏估计量。因为,是残差,所以?又称作误差均方。可用来考察观测值对回归直线的离散程度。β和β.的估计的方差是1Var(B)=S(B)=62Z(x, -x)2Ex?Var(B)=S(Bo)"a,-)627.拟合优度的测量拟合优度是指回归直线对观测值的拟合程度。显然若观测值离回归直线近,则拟合程度好;反之则拟合程度差。6
只需证明 ∑ ( xt - x ) uˆt = ∑ xt uˆt - ∑ x ut ˆ = ∑ xt uˆt = ∑ xt ( - - yˆt β ˆ 0 β ˆ 1 xt) = 0。 上式为正规方程之一。 (5) Cov( , ) = 0 ut ˆ t yˆ 只需证明 ∑ ( -t yˆ y ) uˆt = ∑ yˆt uˆt - ∑ y ut ˆ = ∑ = ∑ ( + xt) t yˆ ut ˆ ut ˆ 0 ˆ β 1 ˆ β = ∑ + ∑ xt = 0 0 ˆ β ut ˆ 1 ˆ β ut ˆ 5.yt 的分布和 的分布 1 ˆ β 根据假定条件 ut ∼ N (0, σ 2 ), E(yt) = E(β0 + β1 xt + ut) = β0 + β1 xt + E(ut) = β0 + β1 xt。 Var(yt) = Var (β0 + β1 xt + ut) = Var (β0 + β1 xt) + Var (ut) = σ 2 yt 是 ut 的线性函数,所以 yt ∼ N (β0 + β1 xt, σ 2 )。 可以证明 E( ) = β1, Var ( ) = 1 ˆ β 1 ˆ β ∑ − 2 )( 1 xxt σ 2 , 1 ˆ β 是 yt 的线性函数( = ∑ kt yt),所以 1 ˆ β 1 ˆ β ∼ N (β1, ∑ − 2 )( 1 xxt σ 2 )。 6.σ 2 的估计 定义 2 σˆ = ( ˆ )2() 2 ∑ t Tu − 其中 2 表示待估参数的个数。可以证明 E( ) = σ 2 。 是σ 2 的无偏估计量。因为 是残 差,所以 又称作误差均方。可用来考察观测值对回归直线的离散程度。 2 σˆ 2 σˆ ut ˆ 2 σˆ 1 ˆ β 和 的估计的方差是 0 ˆ β ∧ Var ( ) = S2 ( ) 1 = ˆ β 1 ˆ β ∑ − 2 )( 1 xxt 2 σˆ , ∧ Var ( ) = S2 ( ) 0 = ˆ β 0 ˆ β ∑ ∑ − 2 2 xxT )( x t t 2 σˆ 7.拟合优度的测量 拟合优度是指回归直线对观测值的拟合程度。显然若观测值离回归直线近,则拟合程度 好;反之则拟合程度差。 6
2824.20(Yt-y)(-y)16X12g,=Bo+Bir8X203040506070图2.3三种离差示意图可以证明 (1-)-(-)+-)=(-)2+(u。SST(总平方和)=SSR(回归平方和)+SSE(残差平方和)证明(1-)-[(1-)+(,-)=-+(-+2(1-)(-)其中Z(t-,)(,-)-(-)(xi-x)=(1-)x-xZ(1-)=,Zi,x=0度量拟合优度的统计量是可决系数(确定系数)。Z(,-J)?R?=(回归平方和)/(总平方和)=SSR/SSTZ(y, -j)?所以R的取值范围是[O,1]。对于一组数据,SST是不变的,所以SSRt(+),SSE!()。SSR:旧指回归平方和(regressionsumofsquares),现指残差平方和(sumof squaredresiduals)SSE:旧指残差平方和(errorsumofsquares(sumofsquarederrors)),现指回归平方和(explainedsumofsquares)8.回归参数的显著性检验及其置信区间主要是检验β是否为零。通常用样本计算的β不等于零,但应检验这是否有统计显著性。Ho: βi= 0;Hi:B*0在Ho成立条件下,Bi-βBS(p)S(p)/ /Z(x, -x)20-1α(T-2)1a(T-2)若/>α(T-2),则β0;若I<tα(T-2),则β=0。7
图 2.3 三种离差示意图 可以证明 ∑(yt - y ) 2 = ∑( -t yˆ y ) 2 + ∑(yt - ) 2 = ∑( - t t yˆ yˆ y ) 2 + ∑( u ) ˆt 2 。 SST(总平方和)= SSR(回归平方和) + SSE(残差平方和) 证明 ∑ (yt - y ) 2 = ∑[ (yt - ) + ( - t t yˆ yˆ y )]2 = ∑ (yt - ) 2 + ∑ ( - t t yˆ yˆ y ) 2 + 2 ∑ (yt - )( - t t yˆ yˆ y ) 其中 ∑ (yt - )( - t yˆ t yˆ y ) = ∑ (yt - ) (xt - t yˆ 1 ˆ β x ) = ∑ (yt - ) xt - 1 ˆ β t yˆ x 1 ˆ β ∑ (yt - ) = ∑ xt = 0 t yˆ 1 ˆ β ut ˆ 度量拟合优度的统计量是可决系数(确定系数)。 R2 = ∑ ∑ − − 2 2 )( ( ˆ ) yy yy t t = (回归平方和)/(总平方和)= SSR/SST 所以 R2 的取值范围是 [0,1]。对于一组数据,SST 是不变的,所以 SSR↑(↓),SSE↓(↑)。 SSR:旧指回归平方和(regression sum of squares),现指残差平方和(sum of squared residuals) SSE:旧指残差平方和(error sum of squares (sum of squared errors)),现指回归平方和 (explained sum of squares) 8.回归参数的显著性检验及其置信区间 主要是检验 β1 是否为零。通常用样本计算的 不等于零,但应检验这是否有统计显著 性。 1 ˆ β H0:β1 = 0; H1:β1 ≠ 0 在 H0 成立条件下, t = ) ˆ ( 11 1 ˆ β ββ s − = 1) ˆ ( 1 ˆ β β s = ∑ − 2 1 ˆ )( ˆ xx σ t β -tα (T-2) 0 tα (T-2) 若 | t | > tα (T-2) ,则 β1 ≠ 0;若 | t | < tα (T-2) ,则 β1 = 0。 7