=∑V一第i群总和F=Y/M一第i群平均值 Y MM ∑∑V一总体平均值 S2=M122x0-1)一总体差异平方和 S3=12(x1-Y)2一群间异平方和 S2= ∑∑(X-)2一群内差异平方和 N(M-1)红 将Y改为y,则为相应的样本指标值
1 M i ij j Y Y = = —第 i 群总和 Y Y M i i = —第 i 群平均值 1 1 1 N M ij i j Y Y NM = = = —总体平均值 2 2 1 1 1 ( ) 1 N M ij i j S Y Y NM = = = − − —总体差异平方和 2 2 1 ( ) 1 N b i i M S Y Y N = = − − —群间差异平方和 2 2 1 1 1 ( ) ( 1) N M w ij i i j S Y Y N M = = = − − —群内差异平方和 将Y 改为y ,则为相应的样本指标值
它们之间的关系为: S=M-/N-1)S2+N(M-1)S21(81) 将Y改为y,n代替N,由于是整群抽样,M仍为M,不难 得到样本方差平方和的关系式: (n-Osh+n(M-1)sw (8.2) nM-1 S可作为S2的估计,但不是无偏估计。这是因为次级单元是 在抽到的群内普查,此时样本不是简单随机的。 由于群的选取是简单随机的,因此sb与s2分别是S2与S2的 无偏估计,于是得到S2的无偏估计为: 2 I(N-1)s2+N(M-1)2l(8.3) M
它们之间的关系为: 2 2 2 1 [( 1) ( 1) ] 1 S N S N M S b w NM = − + − − (8.1) 将 改为 , 代替 ,由于是整群抽样, 仍为 ,不难 得到样本方差平方和的关系式: Y y n N M M 2 2 2 1 [( 1) ( 1) ] 1 b w s n s n M s nM = − + − − (8.2) 可作为 的估计,但不是无偏估计。这是因为次级单元是 在抽到的群内普查,此时样本不是简单随机的。 2 s 2 S 由于群的选取是简单随机的,因此 与 分别是 与 的 无偏估计,于是得到 的无偏估计为: 2 b s 2 w s 2 Sb 2 Sw 2 S 2 2 2 1 ˆ [( 1) ( 1) ] 1 S N s N M s b w NM = − + − − (8.3)
当N相当大时,该估计可近似写为: 22+(M-1)2 (8.4) M 从(82)式可知,若n也足够大的话,S也可写成(84)形式, 此时,s2就可以看作是S的近似无偏估计了 再引进一个群内相关的记号,这个概念的重要性在于 它可以度量群内次级单元的差异程度,因为我们已经知道群 内单元的差异大就可能保证样本的代表性,如何划分群实质 上是一个抽样方案的设计问题。易见设计的效应好还是差在 相当程度上与这个P有关。P的定义为: ECYi-YOk-Y (8.5) E(Y-1)2
2 2 2 ( 1) ˆ b w s M s S M + − (8.4) 当 N 相当大时,该估计可近似写为: 从(8.2)式可知,若n 也足够大的话, 也可写成(8.4)形式, 此时, 就可以看作是 的近似无偏估计了。 2 s 2 S 2 s 再引进一个群内相关的记号 ,这个概念的重要性在于 它可以度量群内次级单元的差异程度,因为我们已经知道群 内单元的差异大就可能保证样本的代表性,如何划分群实质 上是一个抽样方案的设计问题。易见设计的效应好还是差在 相当程度上与这个 有关。 的定义为: c c c 2 ( )( ) ( ) ij ik c ij E Y Y Y Y E Y Y − − = − (8.5)
具体计算得 2∑(-Y)(k-F) i=l j<k P -+-*--(-1)MM-1)S2 (8.6) ∴-(a2+b)s2mb≤(a+b) 计算可得-1sp≤1,P在一定程度上反映了群内单元的 差异,当然这种差异一般是相对于群间差异而言的。它可以 用群内方差S2与群间方差S来表示: 1+(M-M-1)2 (8.7) (MM-1)S 当N足够大时,近似有 p≈(S2-s2)/(M-1)S2 (8.8)
具体计算得 1 2 2 ( )( ) ( 1)( 1) M M ij ik i j k c Y Y Y Y M NM S = − − = − − (8.6) 2 2 2 2 − + + ( ) 2 ( ) a b ab a b 计算可得 , 在一定程度上反映了群内单元的 差异,当然这种差异一般是相对于群间差异而言的。它可以 用群内方差 与群间方差 来表示: 1 1 − c c 2 Sb 2 Sw 2 2 ( 1) 1 ( 1) ( 1) b c M N S M NM S − + − = − (8.7) 当N足够大时,近似有 2 2 2 ( ) ( 1) c b − − S S M S (8.8)
又 s(MWM-1)(1-2)3 MN (8.9) 当N足够大时,近似有 SZ ≈1 (8.10) 由(88)以及(810)可得P的估计 Sb一 (8.11) 2+(M-1)2 由(8.1)也可以发现,考虑N相当大时,当p2≈0,Sb2与S形 几乎相等,也就是说群间方差几乎与群内方差一样,实际上 指出了我们对群的划分完全是随机进行的。如果P≤0,那 么群间的方差远远大于群内方差,群内单元差异相对不显著 将引起样本的代表性差,从而精度一定会差!
当N足够大时,近似有 又 2 2 ( 1)(1 ) c w NM S S MN − − = (8.9) 2 2 1 w c S S − (8.10) 由(8.8)以及(8.10)可得 c 的估计 2 2 2 2 ˆ ( 1) b w c b w s s s M s − + − (8.11) 由(8.11)也可以发现,考虑N相当大时,当 , 与 几乎相等,也就是说群间方差几乎与群内方差一样,实际上 指出了我们对群的划分完全是随机进行的。如果 ,那 么群间的方差远远大于群内方差,群内单元差异相对不显著 将引起样本的代表性差,从而精度一定会差! 0 c 2 Sb 2 Sw 0 c