这样a,b的估计值可写成 b (3.12) a=1-1∑x,) i=1
17 这样a,b的估计值可写成 (3.12) . ˆ 1 1 ˆ , ˆ 1 1 = - = = = x b n y n a S S b n i i n i i x x x y
例2(续例1)设在例1中的随机变量Y符合(32) 所述的条件,求Y关于x的线性回归方程 解现在n=10,所需计算列表如下(表917 100 45 10000 2025 4500 110 51 12100 2601 5610 120 54 14400 2916 6480 130 61 16900 3721 7930 140 66 19600 4356 9240 150 22500 4900 10500 160 74 25600 5476 11840 170 78 28900 6084 13260 180 85 32400 7225 15300 190 89 36100 7921 16910 ∑1450 673 218500 47225 101570
18 例2(续例1) 设在例1中的随机变量Y符合(3.2) 所述的条件, 求Y关于x的线性回归方程. 解 现在n=10, 所需计算列表如下(表9.17): x y x 2 y 2 xy 100 45 10000 2025 4500 110 51 12100 2601 5610 120 54 14400 2916 6480 130 61 16900 3721 7930 140 66 19600 4356 9240 150 70 22500 4900 10500 160 74 25600 5476 11840 170 78 28900 6084 13260 180 85 32400 7225 15300 190 89 36100 7921 16910 1450 673 218500 47225 101570
S=218500--×14502=8250 10 101570-×1450×673=3985, 10 故得b=Sy/Sx=0.48303 ×673-×1450×0.48303=-2.73935, 10 10 于是得到回归直线方程 y=-2.73935+0.48303X 或j=673+048303(x-145)
19 于是得到回归直线方程 1450 0.48303 2.73935, 10 1 673 10 1 ˆ 0.48303, ˆ 1450 673 3985, 10 1 101570 1450 8250, 10 1 218500 2 = - = - = = = - = = - = a b S S S S x y x x x y x x 故 得 ˆ 67.3 0.48303( 145). ˆ 2.73935 0.48303 . = + - = - + y x y x 或
)a的估计 由(32), E{Y-(a+bx)2}=E(a2)=D()+[E(e)2=a2 这表示a2愈小,以回归函数(x)=a+bx作为Y的 近似导致的均方误差就愈小.这样,利用回归 函数山(x)=a+bx去研究随机变量Y与x的关系就 愈有效然而a是未知的,因而需要利用样本 去估计a
20 (三)s2的估计 由(3.2), E{[Y-(a+bx)]2}=E(e 2 )=D(e)+[E(e)]2=s2 这表示s2愈小, 以回归函数m(x)=a+bx作为Y的 近似导致的均方误差就愈小. 这样, 利用回归 函数m(x)=a+bx去研究随机变量Y与x的关系就 愈有效. 然而s2是未知的, 因而需要利用样本 去估计s2
为了估计a2,先引入下述残差平方和 记 ;=外=a+b x=x ,称y=y为x处的残差. 平方和 Q=∑( ∑ Vi -a-bx i=1 (3.13) 称为残差平方和.它是经验回归函数在x处的函 数值A(x1)=a+bx;与x处的观察值y的偏差平 方和
21 为了估计s 2 ,先引入下述残差平方和. 记 i x x i y y a bx i ˆ ˆ ˆ ˆ = | = + = , 称 i i y - yˆ 为 xi 处的残差. 平方和 = = = - = - - n i i i n i e i i Q y y y a bx 1 2 1 2 ) ˆ ( ˆ ) ( ˆ (3.13) 称为残差平方和. 它是经验回归函数在xi处的函 数值 xi a bxi ˆ mˆ( ) = ˆ + 与 xi 处的观察值 yi的偏差平 方和