2、随机误差与无偏估计量 先讨论一个简单的具体例子。设有一个容量为7的总体 由正面盒子给出,如图2-3所示:_+_ 1234567 图2-3 总体平均数和方差为: Y ∑Y S 2 7 ∑(Y-Y)2=467 i=1 7-1a 标准差S=√S2=216 此时,盒子中指标值以及总体的参数Y和S2对于调查者 来说是未知的。调查者的任务就是从总体中抽出一个样本, 构造样本估计量,来推断总体平均数Y和方差S2
2、随机误差与无偏估计量 先讨论一个简单的具体例子。设有一个容量为7的总体 由下面盒子给出,如图2-3所示: 图2-3 1 2 3 4 5 6 7 总体平均数和方差为: 4 7 1 7 1 = = = i i Y Y ( ) 4.67 7 1 1 2 7 1 2 − = − = = S Yi Y i 标准差 2.16 2 S = S = 此时,盒子中指标值以及总体的参数 和 对于调查者 来说是未知的。调查者的任务就是从总体中抽出一个样本, 构造样本估计量,来推断总体平均数 和方差 。 Y Y 2 S 2 S
设样本容量n=3,使用样本(y1,y2,y3)的样本均值和方 差 ∑ns2 3 ∑(1-p)2 3 来估计总体的平均值Y和方差S2。 考虑不放回简单随机抽样,由于抽样是随机的,7个个体中 的任何3个都可能入选样本,所有可能的样本数=C 此时,每一个样本被抽中的概率都相等且为1/ 如抽中样本(2,3,6),则 y=(2+3+6)=367 31(2-367)2+(3-367)2+(6-3.67)21=433
设样本容量n=3,使用样本 的样本均值和方 差 来估计总体的平均值 和方差 。 ( , , ) 1 2 3 y y y i i y y = = 3 3 1 1 2 3 1 2 ( ) 3 1 1 s y y i i − − = = Y 2 S 考虑不放回简单随机抽样,由于抽样是随机的,7个个体中 的任何3个都可能入选样本。所有可能的样本数有 3 7 3 7 = C 此时,每一个样本被抽中的概率都相等且为 3 7 1 如抽中样本(2,3,6),则 (2 3 6) 3.67 3 1 y = + + = [(2 3.67) (3 3.67) (6 3.67) ] 4.33 3 1 2 1 2 2 2 − + − + − = − s =
用它们来估计总体的平均数和方差,误差如下: 对平均数有随机误差y-Y=367-4=-0.33 对方差有随机误差s2-S2=433-467=-034 由于样本是随机的,误差也将随着样本的不同而发生 变化。如果我们的运气不佳,抽到样本(1,2,3),此时 (1+2+3)=2 3 2 1 3y(-2)2+(2-2)2+(3-2)21=1 随机误差分别为 卩-Y=2-4=-2s2-S2=1-467=-367 随机误差就大得许多。也就是说,用样本平均数和方差 来估计总体平均数和方差有时是很糟糕的
用它们来估计总体的平均数和方差,误差如下: 对平均数有随机误差 y −Y = 3.67 − 4 = −0.33 对方差有随机误差 4.33 4.67 0.34 2 2 s − S = − = − 由于样本是随机的,误差也将随着样本的不同而发生 变化。如果我们的运气不佳,抽到样本(1,2,3),此时 (1 2 3) 2 3 1 y = + + = [(1 2) (2 2) (3 2) ] 1 3 1 2 1 2 2 2 − + − + − = − s = 随机误差分别为 y −Y = 2− 4 = −2 1 4.67 3.67 2 2 s − S = − = − 随机误差就大得许多。也就是说,用样本平均数和方差 来估计总体平均数和方差有时是很糟糕的
为什么还要用样本平均数和方差来估计总体平均数和方差呢? 原因一:F和S2是样本平均数尹和方差s2的波动中心 换句话说,虽然估计量y和S会发生随机误差,随机误差 有正有负,但随机误差的平均值为0。或者说,所有可能的 卩和s2的平均值分别为Y和S2。 以前述例子为例:所有可能的y的平均值为 (所有可能的之和=∑2(n+y2+y3) 米箱等 3 11(6 73,×(+2+3+4+5+6+7 34!16! 7!324! ×(1+2+3+4+5+6+7)
为什么还要用样本平均数和方差来估计总体平均数和方差呢? 原因一: Y 和 是样本平均数 和方差 的波动中心 2 S y 2 s ( ) 3 7 1 所有可能的y 之 和 + + = 互不相等 1 2 3 , , 1 2 3 ( ) 3 1 3 7 1 y y y y y y (1 2 3 4 5 6 7) 2 6 3 1 3 7 1 + + + + + + = (1 2 3 4 5 6 7) 2 4 6 3 1 7 3 4 = + + + + + + !! ! ! !! 换句话说,虽然估计量 和 会发生随机误差,随机误差 有正有负,但随机误差的平均值为0。或者说,所有可能的 和 的平均值分别为 和 。 y 2 s y 2 s 2 Y S 以前述例子为例:所有可能的 y 的平均值为
=-(1+2+3+4+5+6+7)=4=Y 类似:所有可能的s的平均值为 7(所有可能的2之和=7∑2∑0-列 米相等 I=1 3 ∑1∑-F)2-3(-F 米相等 i=1 3 3 2(7 ∑∑(2-Y) 2 ∑(-Y) 豈和等1 米箱等 3,34 1,7 2 2 2 2 263
= (1+ 2 + 3 + 4 + 5 + 6 + 7) = 4 = Y 7 1 类似:所有可能的 的平均值为 2 s ( ) 3 7 1 所有可能的s 2 之 和 − = = 互不相等 1 2 3 , , 2 3 1 ( ) 2 1 3 7 1 y y y i i y y − − − = = 互不相等 1 2 3 , , 2 2 3 1 [ ( ) 3( ) ] 2 1 3 7 1 y y y i i y Y y Y − = = 互不相等 1 2 3 , , 2 3 1 ( ) 3 7 1 2 1 y y y i i y Y − − 互不相等 1 2 3 , , 2 ( ) 3 7 1 2 3 y y y y Y 2 2 2 2 6 7 3 1 6 4 2 3 2 3 = − = = S