1=∑-第群总和Y=Y/M第i群平均值 N M F=M>>一总体平均值 S2=M-1220-)一总体差异平方和 M N-1 ∑(1-1)2-群间差异平方和 ∑∑(-)2群内差异平方和 "N(M-1)台台 将Y改为y,则为相应的样本指标值
1 M i ij j Y Y = = —第 i 群总和 Y Y M i i = —第 i 群平均值 1 1 1 N M ij i j Y Y NM = = = —总体平均值 2 2 1 1 1 ( ) 1 N M ij i j S Y Y NM = = = − − —总体差异平方和 2 2 1 ( ) 1 N b i i M S Y Y N = = − − —群间差异平方和 2 2 1 1 1 ( ) ( 1) N M w ij i i j S Y Y N M = = = − − —群内差异平方和 将Y 改为y ,则为相应的样本指标值
它们之间的关系为: S (N-1)2+N(M-1)S2l(8.1) M-1 将Y改为y,n代替N,由于是整群抽样,M仍为M,不难 得到样本方差平方和的关系式: (n-1)b+n(M-1)l (82) mM-1 S可作为S2的估计,但不是无偏估计。这是因为次级单元是 在抽到的群内普查,此时样本不是简单随机的。 由于群的选取是简单随机的,因此S与52分别是Sb与S2的 无偏估计,于是得到S2的无偏估计为: M、y(N-1)2+NM-1)s2l(a 8.3)
它们之间的关系为: 2 2 2 1 [( 1) ( 1) ] 1 S N S N M S b w NM = − + − − (8.1) 将 改为 , 代替 ,由于是整群抽样, 仍为 ,不难 得到样本方差平方和的关系式: Y y n N M M 2 2 2 1 [( 1) ( 1) ] 1 b w s n s n M s nM = − + − − (8.2) 可作为 的估计,但不是无偏估计。这是因为次级单元是 在抽到的群内普查,此时样本不是简单随机的。 2 s 2 S 由于群的选取是简单随机的,因此 与 分别是 与 的 无偏估计,于是得到 的无偏估计为: 2 b s 2 w s 2 Sb 2 Sw 2 S 2 2 2 1 ˆ [( 1) ( 1) ] 1 S N s N M s b w NM = − + − − (8.3)
当N相当大时,该估计可近似写为: 2Sb+(M-1) (8.4) M 从(8.2)式可知,若n也足够大的话,S也可写成(8.4形式, 此时,s就可以看作是S2的近似无偏估计了。 再引进一个群内相关的记号,这个概念的重要性在于 它可以度量群内次级单元的差异程度,因为我们已经知道群 内单元的差异大就可能保证样本的代表性,如何划分群实质 上是一个抽样方案的设计问题。易见设计的效应好还是差在 相当程度上与这个P有关。P的定义为: EC-rCikY EVA (8.5)
2 2 2 ( 1) ˆ b w s M s S M + − (8.4) 当 N 相当大时,该估计可近似写为: 从(8.2)式可知,若n 也足够大的话, 也可写成(8.4)形式, 此时, 就可以看作是 的近似无偏估计了。 2 s 2 S 2 s 再引进一个群内相关的记号 ,这个概念的重要性在于 它可以度量群内次级单元的差异程度,因为我们已经知道群 内单元的差异大就可能保证样本的代表性,如何划分群实质 上是一个抽样方案的设计问题。易见设计的效应好还是差在 相当程度上与这个 有关。 的定义为: c c c 2 ( )( ) ( ) ij ik c ij E Y Y Y Y E Y Y − − = − (8.5)
具体计算得 2∑∑(-Y)(Vk-万) i=l j<k (8.6) ++,(M-D)(M1)S2 -(a2+b2)≤2mb≤(a2+b2) 计算可得-1≤p≤1,p在一定程度上反映了群内单元的 差异,当然这种差异一般是相对于群间差异而言的。它可以 用群内方差S2与群间方差2来表示: 1+(M-1)0= M(N-1)S2 (MM-1)s2 (8.7) 当N足够大时,近似有 p≈(S2-s2)/(M-1s2 (8.8)
具体计算得 1 2 2 ( )( ) ( 1)( 1) M M ij ik i j k c Y Y Y Y M NM S = − − = − − (8.6) 2 2 2 2 − + + ( ) 2 ( ) a b ab a b 计算可得 , 在一定程度上反映了群内单元的 差异,当然这种差异一般是相对于群间差异而言的。它可以 用群内方差 与群间方差 来表示: 1 1 − c c 2 Sb 2 Sw 2 2 ( 1) 1 ( 1) ( 1) b c M N S M NM S − + − = − (8.7) 当N足够大时,近似有 2 2 2 ( ) ( 1) c b − − S S M S (8.8)
又S2= (MM-1)(-p)S2 (8.9) MN 当N足够大时,近似有 P ≈1一 8.10) 2 由(8.8)以及(8.10)可得P的估计 (8.11) +(M-1)s 由(81)可以发现,考虑N相当大时,当P2≈0,Sb与S 几乎相等,也就是说群间方差几乎与群内方差一样,实际上 指出了我们对群的划分完全是随机进行的。如果P≤0,那 么群间的方差远远大于群内方差,群内单元差异相对不显著 将引起样本的代表性差,从而精度一定会差
当N足够大时,近似有 又 2 2 ( 1)(1 ) c w NM S S MN − − = (8.9) 2 2 1 w c S S − (8.10) 由(8.8)以及(8.10)可得 c 的估计 2 2 2 2 ˆ ( 1) b w c b w s s s M s − + − (8.11) 由(8.11)也可以发现,考虑N相当大时,当 , 与 几乎相等,也就是说群间方差几乎与群内方差一样,实际上 指出了我们对群的划分完全是随机进行的。如果 ,那 么群间的方差远远大于群内方差,群内单元差异相对不显著 将引起样本的代表性差,从而精度一定会差! 0 c 2 Sb 2 Sw 0 c