第九章抽样与抽样估计 本章重点:影响抽样平均误差的因素:总体平均数和总体成数的区间估计 §1抽样调查的意义与作用 一、抽样调查的概念、特点 (一)概念:抽样调查是按照随机原则从全部研究对象中抽取一部分单位进行观 察,并依据所获得的数据对全部研究对象的数量特征做出具有一定可靠性的 估计判断,从而达到对全部研究对象的认识的一种统计方法。 (二)、抽样调查的基本特点: 1、根据部分实际资料对全部总体的数量特征做出估计。 2、按随机的原则从全部总体中抽取样本单位。 3、抽样推断的抽样误差可以事先计算并且加以控制。 二、抽样调查的作用: 1、对某些不可能进行全面调查而又要了解其全面情况的社会经济现象,必 须应用抽样调查。 2、对某些社会经济现象虽然可以进行全面调查,但抽样调查可以节约时间、 费用,提高调查的时效性。 3、抽样调查和全面调查同时进行,可以发挥相互补充和检查质量的作用。 4、抽样调查可以用于工业生产过程的质量控制。 5、利用抽样调查原理,还可以对某种总体的假设进行检验,来判断这种假 设的真伪,以决定行动的取舍。 三、抽样调查的理论基础 1、大数法则:关于大量的随机现象具有稳定性质的法则。 2、中心极限定理:如果总体变量存在有限的平均数和方差,那么不论这个 总体变量的分布如何,随着抽样单位数的增加,抽样平均数的分布便趋近于正 态分布
第九章 抽样与抽样估计 本章重点:影响抽样平均误差的因素;总体平均数和总体成数的区间估计 §1 抽样调查的意义与作用 一、抽样调查的概念、特点 (一)概念:抽样调查是按照随机原则从全部研究对象中抽取一部分单位进行观 察,并依据所获得的数据对全部研究对象的数量特征做出具有一定可靠性的 估计判断,从而达到对全部研究对象的认识的一种统计方法。 (二)、抽样调查的基本特点: 1、根据部分实际资料对全部总体的数量特征做出估计。 2、按随机的原则从全部总体中抽取样本单位。 3、抽样推断的抽样误差可以事先计算并且加以控制。 二、抽样调查的作用: 1、对某些不可能进行全面调查而又要了解其全面情况的社会经济现象,必 须应用抽样调查。 2、对某些社会经济现象虽然可以进行全面调查,但抽样调查可以节约时间、 费用,提高调查的时效性。 3、抽样调查和全面调查同时进行,可以发挥相互补充和检查质量的作用。 4、抽样调查可以用于工业生产过程的质量控制。 5、利用抽样调查原理,还可以对某种总体的假设进行检验,来判断这种假 设的真伪,以决定行动的取舍。 三、抽样调查的理论基础 1、大数法则:关于大量的随机现象具有稳定性质的法则。 2、中心极限定理:如果总体变量存在有限的平均数和方差,那么不论这个 总体变量的分布如何,随着抽样单位数 n 的增加,抽样平均数的分布便趋近于正 态分布
2抽样调查中的基本概念 一、总体与样本 1、总体是指根据研究目的确定的所要研究的同类事物的全体,是所要说明其数 量特征的研究对象。其中,构成总体的个别事物(基本单元)就是总体单位,也 称个体。例如,研究学生的成绩,则所有的学生为总体,每一个学生为总体单位: 检察皮鞋厂的皮鞋质量,则所有的皮鞋为总体,每一双皮鞋为总体单位。一个总 体中的总体单位数叫总体容量,一般用N表示。 2、从总体中抽取的部分单位所构成的整体,称为该总体的一个样本。样本所包 含的总体单位个数称为样本容量,一般用n表示。人们通常把n≥30的样本称为 大样本,而把<30的样本称为小样本。样本通常是不确定的、多种多样的。 二、参数与统计量(总体指标与样本指标) 1、在抽样估计中,用来反映总体数量特征的指标称为总体指标,也叫总体参数。 研究目的一经确定,总体也唯一确定了,所以参数的值是客观存在的、是确定的, 也即参数的值是定值。常用的参数有:总体平均数X(或记为“)、总体比例P、 总体标准差σ或方差σ以及总体标志总量(NX)或总体中具有某一属性的单位 总数NP。 2、样本指标又称样本统计量或估计量,是根据样本资料计算的指标。其值随样 本的不同而不同,是个随机变量,抽样估计就是通过统计量的值去估计参数的值。 常用的统计量有:样本平均数x、样本比例(也称样本成数)P、样本标准差S 或样本方差S以及它们的函数。 三、样本容量与样本个数 1、样本容量指一个样本中的单位数,用n表示。 2、样本个数指从总体中抽一个容量为n的样本,有多少个可能的组合,用M表 示。 四、概率抽样与非概率抽样 从总体中抽取样本的方法有概率抽样与非概率抽样两类。 1、概率抽样也叫随机抽样,是指按随机原则抽取样本。概率抽样最基本的组 织方式有:简单随机抽样、分层抽样、等距抽样和整群抽样。概率抽样能有效避
§2 抽样调查中的基本概念 一、总体与样本 1、总体是指根据研究目的确定的所要研究的同类事物的全体,是所要说明其数 量特征的研究对象。其中,构成总体的个别事物(基本单元)就是总体单位,也 称个体。例如,研究学生的成绩,则所有的学生为总体,每一个学生为总体单位; 检察皮鞋厂的皮鞋质量,则所有的皮鞋为总体,每一双皮鞋为总体单位。一个总 体中的总体单位数叫总体容量,一般用 N 表示。 2、从总体中抽取的部分单位所构成的整体,称为该总体的一个样本。样本所包 含的总体单位个数称为样本容量,一般用 n 表示。人们通常把 n≥30 的样本称为 大样本,而把 n<30 的样本称为小样本。样本通常是不确定的、多种多样的。 二、参数与统计量(总体指标与样本指标) 1、在抽样估计中,用来反映总体数量特征的指标称为总体指标,也叫总体参数。 研究目的一经确定,总体也唯一确定了,所以参数的值是客观存在的、是确定的, 也即参数的值是定值。常用的参数有:总体平均数 X (或记为μ)、总体比例 P、 总体标准差σ或方差σ2以及总体标志总量(N X )或总体中具有某一属性的单位 总数 NP。 2、样本指标又称样本统计量或估计量,是根据样本资料计算的指标。其值随样 本的不同而不同,是个随机变量。抽样估计就是通过统计量的值去估计参数的值。 常用的统计量有:样本平均数 x 、样本比例(也称样本成数)P、样本标准差 S 或样本方差 S 2以及它们的函数。 三、样本容量与样本个数 1、样本容量指一个样本中的单位数,用 n 表示。 2、样本个数指从总体中抽一个容量为 n 的样本,有多少个可能的组合,用 M 表 示。 四、概率抽样与非概率抽样 从总体中抽取样本的方法有概率抽样与非概率抽样两类。 1、概率抽样也叫随机抽样,是指按随机原则抽取样本。概率抽样最基本的组 织方式有:简单随机抽样、分层抽样、等距抽样和整群抽样。概率抽样能有效避
免主观选样带来的倾向性误差(系统偏差),使得样本资料能够用于估计和推断 总体的数量特征,而且使这种估计和推断得以建立在概率论和数理统计的科学理 论上,可以计算和控制抽样误差,能够说明估计结果的可靠程度。 2、非概率抽样也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判 断,从总体中有意识地抽取若干单位构成样本。通常有:重点调查、典型调查、 配额抽样、方便抽样等。非概率抽样不能计算和控制其抽样误差,无法说明估计 结果的可靠程度。 五、抽样框 1、抽样框是包括全部抽样单位的名单框架。编制抽样框是实施抽样的基础。抽 样框的好坏通常会直接影响到抽样调查的随机性和调查的效果。 2、抽样框主要有三种形式:①)名单抽样框,即列出全部总体单位的名录一览表, 如职工名单、企业名单等。(②)区域抽样框,即按地理位置将总体范围划分为若 干小区域,以小区域为抽样单位。如对某市居民住房情况进行调查,将全市居民 户划分为若干街道或片区。(③)时间表抽样框,即将总体全部单位按时间顺序排 列,把总体的时间过程分为若干个小的时间单位,以此时间单位为抽样单位。如 对流水线上24小时内生产的产品进行质量抽查时,以5分钟为一个抽样单位, 可将全部产品分为288个抽样单位并按时间顺序排列。 3、一个理想的抽样框应该与目标总体一致,即应包括全部总体单位,既不重复, 也不遗漏(穷尽与互斥)。若有遗漏,易造成系统性误差。 在实践中,要取得与目标总体完全一致的抽样框往往很困难,甚至不可能, 常常只能采用与目标总体近似的抽样框。 六、抽样方法 (一)根据取样方式的不同,抽样方法有重复抽样和不重复抽样两种。 1、重复抽样:是指从总体的个单位中抽取一个容量为的样本,每次抽出一 个单位后,再将其放回总体中参加下一次抽取,这样连续抽次即得到一个样 本。同一总体单位有可能被重复抽中:每个总体单位在每次抽样中被抽中的 概率都是相同的:抽样误差较大。 2、不重复抽样:是指抽中单位不再放回总体中,下一个样本单位只能从余下 的总体单位中抽取。同一总体单位不可能被重复抽中:由于每次抽取是在不
免主观选样带来的倾向性误差(系统偏差),使得样本资料能够用于估计和推断 总体的数量特征,而且使这种估计和推断得以建立在概率论和数理统计的科学理 论上,可以计算和控制抽样误差,能够说明估计结果的可靠程度。 2、非概率抽样也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判 断,从总体中有意识地抽取若干单位构成样本。通常有:重点调查、典型调查、 配额抽样、方便抽样等。非概率抽样不能计算和控制其抽样误差,无法说明估计 结果的可靠程度。 五、抽样框 1、抽样框是包括全部抽样单位的名单框架。编制抽样框是实施抽样的基础。抽 样框的好坏通常会直接影响到抽样调查的随机性和调查的效果。 2、抽样框主要有三种形式:⑴ 名单抽样框,即列出全部总体单位的名录一览表, 如职工名单、企业名单等。⑵ 区域抽样框,即按地理位置将总体范围划分为若 干小区域,以小区域为抽样单位。如对某市居民住房情况进行调查,将全市居民 户划分为若干街道或片区。⑶ 时间表抽样框,即将总体全部单位按时间顺序排 列,把总体的时间过程分为若干个小的时间单位,以此时间单位为抽样单位。如 对流水线上 24 小时内生产的产品进行质量抽查时,以 5 分钟为一个抽样单位, 可将全部产品分为 288 个抽样单位并按时间顺序排列。 3、一个理想的抽样框应该与目标总体一致,即应包括全部总体单位,既不重复, 也不遗漏(穷尽与互斥)。若有遗漏,易造成系统性误差。 在实践中,要取得与目标总体完全一致的抽样框往往很困难,甚至不可能, 常常只能采用与目标总体近似的抽样框。 六、抽样方法 (一)根据取样方式的不同,抽样方法有重复抽样和不重复抽样两种。 1、重复抽样:是指从总体的N个单位中抽取一个容量为n的样本,每次抽出一 个单位后,再将其放回总体中参加下一次抽取,这样连续抽n次即得到一个样 本。同一总体单位有可能被重复抽中;每个总体单位在每次抽样中被抽中的 概率都是相同的;抽样误差较大。 2、不重复抽样:是指抽中单位不再放回总体中,下一个样本单位只能从余下 的总体单位中抽取。同一总体单位不可能被重复抽中;由于每次抽取是在不
同数目的总体单位中进行,每个总体单位在各次抽样中被抽中的概率不相等 抽样误差较小。 (二)、根据对样本的要求不同,抽样方法又有考虑顺序抽样和不考虑顺序抽样 两种: 1、考虑顺序的抽样:即从总体W中抽取个单位构成样本,不但要考虑样本 各单位的不同性质,而且还考虑不同性质各单位的中选顺序。相同构成成分 的单位,由于顺序不同,也作为不同样本。 2、不考虑顺序的抽样:即从总体个单位抽取个单位构成样本。只考虑样本 各单位的组成成分如何,而不考虑单位的抽样顺序。如果样本的成分相同,不 论顺序有多大不同,都作为一种样本。 (三)以上抽样方法的两种分类还存在交叉情况,即有: 考虑顺序的不重复抽样数目A=N(N-1N-2).(W-n+1) 考虑顺序的重复抽样数目B%=N“ 不考虑顺序的不重复抽样数目C:=N-n 不考虑顺序的重复抽样数目Cn=W+n+XW+mXN+n-》W+2 n 七、抽样误差 抽样误差常指随机性误差。有三个相联系的概念,即实际抽样误差、抽样平 均误差、抽样极限误差。 1、实际抽样误差:指某一具体样本估计值与总体参数Q的真实值之间的离差 (0-Q) [例91刂从1、2、3中抽2个(重复),参数取总体平均数μ(等于2),则实 际抽样误差如下: 样本 样本统计量x实际抽样误差(x-μ) (1、1) 1 -1 (1、2) 1.5 -0.5 (1、3) 2 0 (2、1) 1.5 -0.5 (2、2) 2
同数目的总体单位中进行,每个总体单位在各次抽样中被抽中的概率不相等; 抽样误差较小。 (二)、根据对样本的要求不同,抽样方法又有考虑顺序抽样和不考虑顺序抽样 两种: 1、考虑顺序的抽样:即从总体N 中抽取n个单位构成样本,不但要考虑样本 各单位的不同性质,而且还考虑不同性质各单位的中选顺序。相同构成成分 的单位,由于顺序不同,也作为不同样本。 2、不考虑顺序的抽样:即从总体N个单位抽取n个单位构成样本。只考虑样本 各单位的组成成分如何,而不考虑单位的抽样顺序。如果样本的成分相同,不 论顺序有多大不同,都作为一种样本。 (三)以上抽样方法的两种分类还存在交叉情况,即有: 考虑顺序的不重复抽样数目 ( 1)( 2).( 1) n A N N N N n N = − − − + 考虑顺序的重复抽样数目 n n BN = N 不考虑顺序的不重复抽样数目 !( )! ! n N n N C n N − = 不考虑顺序的重复抽样数目 1 ( 1)( )( 1).( 2) ! n N n N n N n N n N C n + + + + + + − + = 七、抽样误差 抽样误差常指随机性误差。有三个相联系的概念,即实际抽样误差、抽样平 均误差、抽样极限误差。 1、实际抽样误差:指某一具体样本估计值 Q ˆ 与总体参数 Q 的真实值之间的离差 ( Q ˆ -Q) [例 9-1] 从 1、2、3 中抽 2 个(重复),参数取总体平均数μ(等于 2),则实 际抽样误差如下: 样本 样本统计量 x 实际抽样误差( x -μ) (1、1) 1 -1 (1、2) 1.5 -0.5 (1、3) 2 0 (2、1) 1.5 -0.5 (2、2) 2 0
(2、3)2.5 0.5 (3、1) (3、2) 2.5 0.5 3、3) 3 2、抽样平均误差,指样本统计量的标准差,如果统计量取均值,则为4:,取 比率,则为山。 八、成数(比率) 1、成数指总体具有某种特征的单位数占总单位数的比重。用P表示。当某单位 具有某种特征时,赋予其变量值为1:当某单位不具有某种特征时,赋予其变量 值为0。 2、设资料如下表:求其平均数和标准差。 变量变量值单位数 是1 INI 非0 合计L N 则P=NN, Q=No/N P+Q=1 对1xN+0x=P 平均数x了 N 标准差 x-xf ∑f PN.-P)N.-P)r+0-PP =PL-P) $2抽样平均误差 一、抽样分布的概念 抽样分布是指样本统计量的概率分布,由样本统计量的可能取值与之相应的概 率组成。对于抽样分布,可计算其平均数和标准差差等数字特征来反映该分布的 中心和离散趋势。 二、抽样分布的集中趋势与离中趋势的测定 (一)样本平均数的抽样分布的集中趋势与离中趋势的测定
(2、3) 2.5 0.5 (3、1) 2 0 (3、2) 2.5 0.5 (3、3) 3 1 2、抽样平均误差,指样本统计量的标准差,如果统计量取均值,则为 x ,取 比率,则为 P 。 八、成数(比率) 1、成数指总体具有某种特征的单位数占总单位数的比重。用 P 表示。当某单位 具有某种特征时,赋予其变量值为 1;当某单位不具有某种特征时,赋予其变量 值为 0。 2、设资料如下表:求其平均数和标准差。 变量 变量值 单位数 是 1 N1 非 0 N0 合计 - N 则 P= N1/N, Q= N0/N P+Q=1 平均数 x p = f xf = N N1 N0 1 + 0 =P 标准差 p = ( ) − f x x f 2 = ( ) ( ) N p N P N0 2 1 2 1− + 0− = ( P) P ( P)P 2 2 1− + 1− = P(1− P) §2 抽样平均误差 一、抽样分布的概念 抽样分布是指样本统计量的概率分布,由样本统计量的可能取值与之相应的概 率组成。对于抽样分布,可计算其平均数和标准差差等数字特征来反映该分布的 中心和离散趋势。 二、抽样分布的集中趋势与离中趋势的测定 (一)样本平均数的抽样分布的集中趋势与离中趋势的测定