第五章比估计与回归估计 第一节比估计的一般形式 第二节分层比估计 第三节回归估计的一般形式 第四节分层回归估计
第五章 比估计与回归估计 • 第一节 比估计的一般形式 • 第二节 分层比估计 • 第三节 回归估计的一般形式 • 第四节 分层回归估计
第一节比估计的一般形式 、比估计综述 比估计是依据调查变量与辅助变量间的比率来对总体有关参数进行估 计和推断。通常简称比估计。 同简单估计相比,比估计具有以下特点 点些要录轴阶变的是体:均在成(体总调2已关图的为 利用辅助变量带来的信息估计总体参数,比单纯用调査变量资料会有 更好的效果。 2)比估计方法,对抽样调查单元是有条件的,通常是用组成总体的 最基层单位为调查单元。 3)比估计只适用于有限总体,因为只有有限总体才可能计算出为比 估计所需要的辅助变量的总体总和与总体均值。 4)当每个单元的调查变量与辅助变量的比例(一般要求为正比例) 分稳定:具变异很小时,比估计就具有分精确的估计效果,只要抽 取少量的样本单元,就可得到满意的结论 5)在比估计时,出于估计精度方面的要求,选择辅助变量时,须与 调查变量的关系愈密切愈好,至少要求相关系数在1/2以上
第一节 比估计的一般形式 • 一、比估计综述 • 比估计是依据调查变量与辅助变量间的比率来对总体有关参数进行估 计和推断。通常简称比估计。 • 同简单估计相比,比估计具有以下特点: • (1)在比估计中,除调查变量外,还需要了解与调查变量有关的辅助 变量,并且要求辅助变量的总体均值或总体总和必须事先已知。充分 利用辅助变量带来的信息估计总体参数,比单纯用调查变量资料会有 更好的效果。 • (2)比估计方法,对抽样调查单元是有条件的,通常是用组成总体的 最基层单位为调查单元。 • (3)比估计只适用于有限总体,因为只有有限总体才可能计算出为比 估计所需要的辅助变量的总体总和与总体均值。 • (4)当每个单元的调查变量与辅助变量的比例(一般要求为正比例)十 分稳定,且变异很小时,比估计就具有十分精确的估计效果,只要抽 取少量的样本单元,就可得到满意的结论。 • (5)在比估计时,出于估计精度方面的要求,选择辅助变量时,须与 调查变量的关系愈密切愈好,至少要求相关系数在1/2以上
比估计中,辅助变量可以是上次普查或调查时与 调査变量相应的数据(即调查变量的前期或历史资 料):也可以是对调查变量的粗略估计;或者是表 示单元规模的某个量 为了充分发挥比估计的优越性,在应用比估计时 应考虑两条: 是选与调查变量有较密切的正相关关系的变量 作为辅助变量。因为如果辅助变量与调査变量的 关系不密切,各自独立变化,则对比估计起不了 应有的辅助作用 是样本容量要比较大。因为比估计是有偏倚的, 只有当样本容量n比较大时,其偏倚才能比较小, 比估计才更加有效
• 比估计中,辅助变量可以是上次普查或调查时与 调查变量相应的数据(即调查变量的前期或历史资 料);也可以是对调查变量的粗略估计;或者是表 示单元规模的某个量。 • 为了充分发挥比估计的优越性,在应用比估计时 应考虑两条: • 一是选与调查变量有较密切的正相关关系的变量 作为辅助变量。因为如果辅助变量与调查变量的 关系不密切,各自独立变化,则对比估计起不了 应有的辅助作用。 • 二是样本容量要比较大。因为比估计是有偏倚的, 只有当样本容量n比较大时,其偏倚才能比较小, 比估计才更加有效
二、总体比率的估计 设总体有N个单元,对每个单元考虑两个指标y和x。抽取容量为n的简单随机样本, 则总体比率R的估计量为 X X 比率估计是有偏的,但当样本量n增大时,偏倚逐渐趋于零。 其方差为 6、-∑0- N-1 nF(s,+rs_RS Ks 々F2(S2+R2S2-2R
二、总体比率的估计 设总体有 N 个单元,对每个单元考虑两个指标 y 和 x。抽取容量为 n 的简单随机样本, 则总体比率 R 的估计量为: , ˆ x y x y R = = 比率估计是有偏的,但当样本量n增大时,偏倚逐渐趋于零。 其方差为 ( 2 ) 1 1 ( ) 1 ) ˆ ( 2 2 2 2 1 2 2 y x yx N i i i S R S RS nX f N y Rx nX f V R + − − = − − − = ( 2 ) 1 2 2 2 2 y x y x S R S R S S nX f + − − =
当总体方差未知时,可用样本方差替代,以估计方差 此时 ∑(y-Rx) V1(R) nX2 YnR(s+RSr yx 总体均值和总和的比估计 当调査变量和辅助变量具有正相关关系时,为了利用辅助变量的信息,可以 构造总体均值或总和的比估计量。在简单随机抽样中,总体均值和总体总和 的比估计量分别为 ==x=R7 X=LX=RX=YN
当总体方差未知时,可用样本方差替代,以估计方差。 此时 ) ˆ 2 ˆ ( 1 1 ) ˆ ( 1 ) ˆ ( ˆ 2 2 2 2 1 2 1 2 y x yx N i i i s R s Rs nX f n y Rx nX f V R + − − = − − − = = 三、总体均值和总和的比估计 当调查变量和辅助变量具有正相关关系时,为了利用辅助变量的信息,可以 构造总体均值或总和的比估计量。在简单随机抽样中,总体均值和总体总和 的比估计量分别为 X RX x y X x y YR ˆ ˆ = = = X RX Y N x y X x y YR R ˆ ˆ ˆ = = = =