又如,一批食品罐头共20000桶,随机抽査了300桶,发现其中有6桶不合 格,求合格品率的抽样误差。 样本的合格品率为:p 300-6 98% σ未知,用s代替 ①重复:u=,/2(1-p) 8×0.02 0.00808 300 PI-P)N 1)098×02600030 V3060001 =0.00806 ②不重复: 由上看出,当N很大时,N接近于1,所以,两种方法计算结果相差很 N 小 三、抽样极限误差 (一)抽样极限误差的意义 抽样极限误差是从另一个角度考虑抽样误差问题的。用抽样指标来估计总体 指标,要达到完全准确,毫无误差这几乎是不可能的事情。所以在估计总体指标 的同时,必须同时考虑估计误差的大小。我们不希望误差太大,误差越大,样本 的价值便越小。但也不是误差越小越好,因为在一定限度之后,减力抽样误差势 必会增加很多费用。因此,在进行抽样估计时,应根据研究对象的变异程度及分 析任务的要求确定一个最大可以充许的误差范围。凡在这个范围内的数字都是有 效的。我们把这种可以允许的误差范围称为抽样极限误差。它等于样本指标可允 许变动的上限或下限与总体指标之差的绝对值。 设△x△分别表示抽样平均数和抽样成数的极限误差,则有: △。=|p-P 本来总体指标是固定不变的,样本指标围绕它上下波动,但是现在的目的是 要估计总体指标,∴将上式转化为不等式关系为 p-A≤Psp+Δ 区间Lx△-,x+△ 分别称为总体平均数的置信区间 总体成数的置信区间
又如,一批食品罐头共 20000 桶,随机抽查了 300 桶,发现其中有 6 桶不合 格,求合格品率的抽样误差。 样本的合格品率为: 300 6 98% 300 p ① 重复: (1 ) 0.98 0.02 0.00808 300 p p p = μ n ②不重复: ) 0.00806 60000 1 60000 300 ( 300 0.98 0.2 ) 1 ( (1 ) N N n n p p up 由上看出,当 N 很大时, 1 N n N 接近于 1,所以,两种方法计算结果相差很 小。 三、抽样极限误差 (一)抽样极限误差的意义 抽样极限误差是从另一个角度考虑抽样误差问题的。用抽样指标来估计总体 指标,要达到完全准确,毫无误差这几乎是不可能的事情。所以在估计总体指标 的同时,必须同时考虑估计误差的大小。我们不希望误差太大,误差越大,样本 的价值便越小。但也不是误差越小越好,因为在一定限度之后,减力抽样误差势 必会增加很多费用。因此,在进行抽样估计时,应根据研究对象的变异程度及分 析任务的要求确定一个最大可以充许的误差范围。凡在这个范围内的数字都是有 效的。我们把这种可以允许的误差范围称为抽样极限误差。它等于样本指标可允 许变动的上限或下限与总体指标之差的绝对值。 设x 、p 分别表示抽样平均数和抽样成数的极限误差,则有: 本来总体指标是固定不变的,样本指标围绕它上下波动,但是现在的目的是 要估计总体指标,将上式转化为不等式关系为: 区间 、 分别称为总体平均数的置信区间、 总体成数的置信区间。 x x X P p P
例如,要估计某乡粮食亩产和总产水平,从80000亩粮食作物中,用不重复 抽样的方式取400亩,求得亩产为450公斤。若规定误差不超过5公斤,这就要 求粮食亩产在445到455公斤之间,而粮食总产在8000×445至8000×550公斤 之间。 又如,要估计移栽的某农作物苗的成活率,从播种这一秧苗的地块中随机抽 取秧苗100棵,其中死苗8棵,则样本秧苗的成活率为92%,若远见定误差不超 过5%,就要求该种农作物苗的成活率P落在87%至97%之间。 (二)抽样极限误差的概率度 基于概率估计的要求,抽样极限误差通常需要以抽样平均误误差μ为标准单 位来衡量。用极限误差△除以μ得相对数Z,表示误差范围为抽样平均误差的Z 倍。一般把Z称为概率度 将△转化为z,实际上是将一般正态分布转化为标准正态分布的过程 在大样本条件下,不论总体是否是正态分布,抽样指标都服从或逼近正态分 布 正态分布的密度函数为:f(x)= e 它的分布不仅取决于x,而且也取决于G 当σ固定,x不等,决定分布的位置,形状不变;当x固定,决定图形 的形状,而位置不变。所以实质中,积分面积很难制定。 当 x=00=1时,函数为:f(x) 将它称为标准正态分布,概率积分表是根据标准正态分布密度函数编制的。 可将一般正态分布转化为标准正态分布 这时E( 0
例如,要估计某乡粮食亩产和总产水平,从 80000 亩粮食作物中,用不重复 抽样的方式取 400 亩,求得亩产为 450 公斤。若规定误差不超过 5 公斤,这就要 求粮食亩产在 445 到 455 公斤之间,而粮食总产在 8000×445 至 8000×550 公斤 之间。 又如,要估计移栽的某农作物苗的成活率,从播种这一秧苗的地块中随机抽 取秧苗 100 棵,其中死苗 8 棵,则样本秧苗的成活率为 92%,若远见定误差不超 过 5%,就要求该种农作物苗的成活率 P 落在 87%至 97%之间。 (二)抽样极限误差的概率度 基于概率估计的要求,抽样极限误差通常需要以抽样平均误误差µ为标准单 位来衡量。用极限误差△除以µ得相对数 Z,表示误差范围为抽样平均误差的 Z 倍。一般把 Z 称为概率度。 x x z ; p p z ; 将△转化为 z,实际上是将一般正态分布转化为标准正态分布的过程。 在大样本条件下,不论总体是否是正态分布,抽样指标都服从或逼近正态分 布。 正态分布的密度函数为: 它的分布不仅取决于 x,而且也取决于 。 当 2 固定, x不等,决定分布的位置,形状不变;当 x 固定, 2 决定图形 的形状,而位置不变。所以实质中,积分面积很难制定。 当 x 0 , 1 时,函数为: 将它称为标准正态分布,概率积分表是根据标准正态分布密度函数编制的。 可将一般正态分布转化为标准正态分布: 令 2 2 1 2 1 e 2 x x f x 1 2 2 1 e 2 x f x x x z ( ) 0 x x E 这时