2、最优抽样比 二阶抽样存在两次概率抽样,因而存在两个抽样比f,f2 因此我们面临的问题是:()在总费用给定的条件下,如何 确定/与使p的方差达到最小;(2)在给定估计量的精 度mr()条件下,如何确定f与以使总费用最小。 如果初级单元(或群)之间的旅行费用不占重要地位的 话,常采用简单线性费用函数: C=c+cn+c nm (9.3) 其中c是基本费用,c1,C2是每调查一个初级单元与次级单元 所花费的费用 将方差表达成: vmr()=(382、S2、S2S2 M nm (9.4)
2、最优抽样比 如果初级单元(或群)之间的旅行费用不占重要地位的 话,常采用简单线性费用函数: 二阶抽样存在两次概率抽样,因而存在两个抽样比 因此我们面临的问题是:(1)在总费用给定的条件下,如何 确定 与 而使 的方差达到最小;(2)在给定估计量的精 度 条件下,如何确定 与 以使总费用最小。 y 1 2 f f , 1 f 2 f 1 f 2 Var y( ) f 0 c 1 2 其中 是基本费用, c c, 是每调查一个初级单元与次级单元 所花费的费用。 C c c n c nm = + + 0 1 2 (9.3) 将方差表达成: 2 2 2 2 2 2 1 1 1 ( ) ( ) S S S Var y S n M nm N = − + − (9.4)
于是,在固定C下极小化va()或在固定ar()下极小化 C均等价于使下式极小化: (mr()+S2C-co)=I(S2-2)+2(c1+c2m) N △(S+-)(c1+C2m)(95) 其中:S2=2S2 但这里要求S=S2-32≥0 M 假如2=s2-S2 <0,表明群内差异明显地大于群间的差异 因此对于抽到的群来说,最好作全面调查才能保证样本的代 表性,此时总使m=M。 现考虑S=S2-220
于是,在固定C下极小化 或在固定 下极小化 C均等价于使下式极小化: Var y( ) Var y( ) 2 2 2 2 0 1 S S S M 其中: = − 。但这里要求 。 2 2 2 2 0 1 0 S S S M = − 2 2 2 2 0 1 0 S S S M 假如 = − ,表明群内差异明显地大于群间的差异, 因此对于抽到的群来说,最好作全面调查才能保证样本的代 表性,此时总使m=M。 2 2 2 2 0 1 0 S S S M 现考虑 = − 2 2 2 2 2 2 1 0 1 1 2 2 2 2 0 1 2 1 ( ( ) )( ) [( ) ]( ) ( )( ) S S Var y S C c S c c m N M m S S c c m m + − = − + + + + (9.5)
在(95)式中,由于S2,S2,c1,C2都是常数,为使(95达到最 小,只要 Q Ci +sc m (9.6) ---单一--一一 达到最小,这两个加项的乘积恰好为常数SS2c1c2,因此 只要这两项相等就可使Q达到最小,此时应取 √m Can 或者m的最优取值为: 2 opt (9.7) 0 一般地,m2m不是整数,记mm.mm的最小整数部分,那 么mm={mml+a(a为mm的小数部分,且a>0)
在(9.5)式中,由于 都是常数,为使(9.5)达到最 小,只要 2 2 0 2 1 2 S S c c , , , 2 2 1 2 0 2 S c Q S c m m = + (9.6) 达到最小,这两个加项的乘积恰好为常数 ,因此 只要这两项相等就可使Q达到最小,此时应取 2 2 S S c c 0 2 1 2 2 1 0 2 S c S m c m = 或者m的最优取值为: 2 1 0 2 opt S c m S c = (9.7) 一般地, 不是整数,记 为 的最小整数部分,那 么 ( 为 的小数部分,且 )。 mopt mopt [ ] mopt [ ] m m a opt opt = + a mopt a 0
如果a2>(1-2a)mml,则取m=mml+1 如果a2≤(1-2a)mnml,则取m=lmrl 易见,对于mn的小数部分大于或等于0.5的情况,我们总取 m=mnl+1,这符合通常的“五入”规则,是否“四舍” 当a<0.5时,就要看mn的最小整数部分的大小了。 由m的选取,代入(9,3)或(94)立即可以得到n的数值。 3、分层二阶抽样 所谓分层二阶抽样就是将总体分为k个层,在每层内进 行二阶抽样。比如,一所大学有8个系,每个系有若千个班 级,每班大约人数为40人,为了解学生的情况需要作一次抽 样调查,在每个系都随机抽几个班,再在抽中的班级里抽取 若干人的简单随机抽样,这就构成二阶分层抽样
2 (1 2 )[ ] 如果 a a m − opt ,则取 m m = + [ ] 1 opt 如果 a a m 2 − (1 2 )[ ] opt ,则取 [ ] m m = opt 易见,对于 的小数部分大于或等于0.5的情况,我们总取 ,这符合通常的“五入”规则,是否“四舍”? 当 时,就要看 的最小整数部分的大小了。 mopt [ ] 1 m m = + opt a 0.5 mopt 由 m 的选取,代入(9.3)或(9.4)立即可以得到 n 的数值。 3、分层二阶抽样 所谓分层二阶抽样就是将总体分为k 个层,在每层内进 行二阶抽样。比如,一所大学有8 个系,每个系有若干个班 级,每班大约人数为40人,为了解学生的情况需要作一次抽 样调查,在每个系都随机抽几个班,再在抽中的班级里抽取 若干人的简单随机抽样,这就构成二阶分层抽样
本节讨论的二阶分层抽样,假设在同一层内初级单元大 小相等,但不同层可以不相等。设第h层含N个初级单元, 每个初级单元包含M个次级单元,于是总体中共含有∑NM 个次级单元。又假设在第h层按照简单随机抽样方法抽取nn 个初级单元,在每个被抽中的初级单元中再抽取容量为的 简单随机抽样。 设第h层中样本的(二阶抽样)平均数为y,因此按照分 层估计的技巧,总体的(按次级单元)平均数F的分层二阶估 计量为: ∑NMPk 一△∑W(9.) ∑ NM h=1 h =1 其中W为第h层(按次级单元)的层权:
本节讨论的二阶分层抽样,假设在同一层内初级单元大 小相等,但不同层可以不相等。设第 h 层含 个初级单元, 每个初级单元包含 个次级单元,于是总体中共含有 个次级单元。又假设在第h 层按照简单随机抽样方法抽取 个初级单元,在每个被抽中的初级单元中再抽取容量为 的 简单随机抽样。 Nh Mh 1 k h h h N M = nh mh h 设第 h 层中样本的(二阶抽样)平均数为 y ,因此按照分 层估计的技巧,总体的(按次级单元)平均数 的分层二阶估 计量为: Y 1 1 1 k h h h k h st h h k h h h h N M y y W y N M = = = = (9.8) 其中 Wh 为第 h 层(按次级单元)的层权: