第六章抽样推断 教学内容: 1.抽样推断的含义、作用 2.抽样推断中的基本概念 3.抽样误差的概念、影响因素 4.概率度、概率保证程度的含义及其二者之间的关系 5.总体参数的抽样估计方法 6.随机抽样的几种抽样组织方式(含义、样本容量的确定、抽样误差的计算) 教学重点 1.抽样误差的概念、影响因素 2.总体参数的抽样估计方法 教学难点 1.抽样平均误差、极限误差的含义及其关系 2.极限误差、概率、概率度的含义及其关系 授课学时:11学时 第一节抽样推断的意义和作用 、抽样推断的概念及特点 抽样推断是按照随机的原则从总体中抽取一部分调查单位进行观察,并依据 所获得的部分单位的数量特征对全部研究对象的数量特征做出具有一定可靠性 的估计和判断,从而达到对总体现象的认识的一种方法。 它有如下特点: 1.它是由部分来推断总体的 统计研究的目的是要认识总体现象的数量特征,但不是所有的现象都可能或 可以进行全面调查来达到这种目的,有许多现象我们只能对总体的一部分单位进 行调查,而在认识上又必须对总体的数量特征作出估计和判断,这就产生了矛盾 如,我们要了解炮弹的射程,又不能对每一枚炮弹一一进行测试,要了解某一品 种棉花纤维的长度,不可能对每一根纤维都进行检验等,而抽样推断法就解决了 这个矛盾 2.按照随机的原则抽取调查单位 随机原则指在抽取调查单位时,完全排除了调查者主观因素的影响,保证总 体中每个单位都有机会中选。抽样推断就是以“按照随机原则抽取样本”为前提 的,只有遵守了随机原则,才能有更大的可能性使所抽取的样本结构与总体结构 类似,也只有遵守了随机原则,才可能对抽样误差的范围加以估计和控制
第六章 抽样推断 教学内容: 1.抽样推断的含义、作用 2.抽样推断中的基本概念 3.抽样误差的概念、影响因素 4.概率度、概率保证程度的含义及其二者之间的关系 5.总体参数的抽样估计方法 6.随机抽样的几种抽样组织方式(含义、样本容量的确定、抽样误差的计算) 教学重点: 1.抽样误差的概念、影响因素 2.总体参数的抽样估计方法 教学难点: 1.抽样平均误差、极限误差的含义及其关系 2.极限误差、概率、概率度的含义及其关系 授课学时:11 学时 第一节 抽样推断的意义和作用 一、抽样推断的概念及特点 抽样推断是按照随机的原则从总体中抽取一部分调查单位进行观察,并依据 所获得的部分单位的数量特征对全部研究对象的数量特征做出具有一定可靠性 的估计和判断,从而达到对总体现象的认识的一种方法。 它有如下特点: 1.它是由部分来推断总体的 统计研究的目的是要认识总体现象的数量特征,但不是所有的现象都可能或 可以进行全面调查来达到这种目的,有许多现象我们只能对总体的一部分单位进 行调查,而在认识上又必须对总体的数量特征作出估计和判断,这就产生了矛盾。 如,我们要了解炮弹的射程,又不能对每一枚炮弹一一进行测试,要了解某一品 种棉花纤维的长度,不可能对每一根纤维都进行检验等,而抽样推断法就解决了 这个矛盾。 2.按照随机的原则抽取调查单位 随机原则指在抽取调查单位时,完全排除了调查者主观因素的影响,保证总 体中每个单位都有机会中选。抽样推断就是以“按照随机原则抽取样本”为前提 的,只有遵守了随机原则,才能有更大的可能性使所抽取的样本结构与总体结构 类似,也只有遵守了随机原则,才可能对抽样误差的范围加以估计和控制
3.抽样误差是不可避免的,但可以事先计算并加以控制 样本对总体的代表性总会发生误差,但是抽样误差的范围可以事先通过有关 资料加以计算,并且通过一定的组织措施来控制这个误差范围,保证抽样推断的 结果达到一定的可靠程度 、抽样推断的作用 1.在无法或很困难进行全面调查情况下,可以应用抽样法来了解全面情况 ①有些现象的总体过大,单位过于分散,不可能进行全面调查。如水库鱼苗 数、森林的木材积蓄量、居民家计调查等。 ②具有破坏性和损耗性的检查和试验,不可能进行全面调查。如轮胎的行驶 里程、灯炮的耐用时间、电视机的抗震能力、罐头食品的卫生检査、人体白血球 数量的化验、炮弹的杀伤力等都具有破坏性,不可能进行一一的检查试验 2.应用抽样法不但比全面调查有更大的优越性,并可对全面调查的结果加以 补充和订正。 ①有些现象可以进行全面调查,但它费时费力、参加人员多、登记性误差大, 若用抽样法可省时、省力、及时取得统计资料。 ②应用抽样法可以对全面调查的结果加以补充和订正。全面调查单位多、范 围广、参加人员多、人员素质相对低下、登计性误差大。若在全面调查之后,随 机抽取一部分调査单位进行抽样调查,将这些单位两次调查的结果进行对照,计 算其差错率,以修正全面调査资料,这样可以提髙全面调査资料的准确性。 例如,全国人口普査,在填报和复查完毕后,按照规定再抽取一定比例的人 数,重新进行调查,由于后者人数少,登记性误差小,调査比较准确,将两次调 査的结果进行比较,并计算全面调查重复或遗漏的差错率,订正普查数字。 3.用于生产过程中产品质量的检查和控制 抽样推断可以随时检査生产工艺过程是否正常,是否存在某些系统性偏误 (尺寸统计偏大或偏小等),及时提供有关信息,以便采取措施,预防大批次品、 废品的发生。 4.可以对总体的某种假设进行检验
3.抽样误差是不可避免的,但可以事先计算并加以控制 样本对总体的代表性总会发生误差,但是抽样误差的范围可以事先通过有关 资料加以计算,并且通过一定的组织措施来控制这个误差范围,保证抽样推断的 结果达到一定的可靠程度。 二、抽样推断的作用 1.在无法或很困难进行全面调查情况下,可以应用抽样法来了解全面情况 ①有些现象的总体过大,单位过于分散,不可能进行全面调查。如水库鱼苗 数、森林的木材积蓄量、居民家计调查等。 ②具有破坏性和损耗性的检查和试验,不可能进行全面调查。如轮胎的行驶 里程、灯炮的耐用时间、电视机的抗震能力、罐头食品的卫生检查、人体白血球 数量的化验、炮弹的杀伤力等都具有破坏性,不可能进行一一的检查试验。 2.应用抽样法不但比全面调查有更大的优越性,并可对全面调查的结果加以 补充和订正。 ①有些现象可以进行全面调查,但它费时费力、参加人员多、登记性误差大, 若用抽样法可省时、省力、及时取得统计资料。 ②应用抽样法可以对全面调查的结果加以补充和订正。全面调查单位多、范 围广、参加人员多、人员素质相对低下、登计性误差大。若在全面调查之后,随 机抽取一部分调查单位进行抽样调查,将这些单位两次调查的结果进行对照,计 算其差错率,以修正全面调查资料,这样可以提高全面调查资料的准确性。 例如,全国人口普查,在填报和复查完毕后,按照规定再抽取一定比例的人 数,重新进行调查,由于后者人数少,登记性误差小,调查比较准确,将两次调 查的结果进行比较,并计算全面调查重复或遗漏的差错率,订正普查数字。 3.用于生产过程中产品质量的检查和控制 抽样推断可以随时检查生产工艺过程是否正常,是否存在某些系统性偏误 (尺寸统计偏大或偏小等),及时提供有关信息,以便采取措施,预防大批次品、 废品的发生。 4.可以对总体的某种假设进行检验
可以对总体的某种假设进行检验,来判断这种假设的真伪,决定行动的取舍。 新工艺、新配方推广后是否有显著的效果,可以作出某种假设,并确定接受或拒 绝的标准,然后应用抽样推断的方法根据抽样结果对所作的假设进行检验,作出 判断。某种药品临床试验,负作用有多大,效果怎样等。 第二节抽样推断中的基本概念 全及总体和样本总体 (一)全及总体(母体、总体) 概念:它是我们所要了解、认识对象的全体,是由具有某种共同性质的许多 单位构成的。 例如,我们要对西安石油大学所有学生进生统计,西安石油大学的所有学生 构成一个总体;要对某个企业的产品质量进行检验,则该厂所有的产品构成一个 总体。 全及总体的单位数用N表,(N总是很大的) 种类:全及总体按所研究标志的性质不同分为:变量总体、属性总体。 ①变量总体:对于一个总体,若被研究的标志属于数量标志,则把这个总体 称为变量总体。 如反映职工的工资高低、学生的学习成绩、居民的收入水平等,则职工、学 生、居民总体均为变量总体。 ②属性总体:对于一个总体,若被研究的标志属于品质标志,则把这个总体 称为属性总体。 如反映机器设备的完好情况(完全不完好),反映性别差异的新生婴儿总体 反映质量好坏的产品总体等。 对于总体按其所包含的单位数多少分为:有限总体、无限总体。 有限总体:总体中所包含的单位数是有限的,变量的取值也是有限的。如 个工厂的设备、台数,一个国家的人口数等 无限总体:总体中所包含的单位数有无限多。如自然科学中的实验,它可以 无限次地进行下去,因此,也只能通过抽样取得数据
可以对总体的某种假设进行检验,来判断这种假设的真伪,决定行动的取舍。 新工艺、新配方推广后是否有显著的效果,可以作出某种假设,并确定接受或拒 绝的标准,然后应用抽样推断的方法根据抽样结果对所作的假设进行检验,作出 判断。某种药品临床试验,负作用有多大,效果怎样等。 第二节 抽样推断中的基本概念 一、全及总体和样本总体 (一)全及总体(母体、总体) 概念:它是我们所要了解、认识对象的全体,是由具有某种共同性质的许多 单位构成的。 例如,我们要对西安石油大学所有学生进生统计,西安石油大学的所有学生 构成一个总体;要对某个企业的产品质量进行检验,则该厂所有的产品构成一个 总体。 全及总体的单位数用 N 表,(N 总是很大的) 种类:全及总体按所研究标志的性质不同分为:变量总体、属性总体。 ①变量总体:对于一个总体,若被研究的标志属于数量标志,则把这个总体 称为变量总体。 如反映职工的工资高低、学生的学习成绩、居民的收入水平等,则职工、学 生、居民总体均为变量总体。 ②属性总体:对于一个总体,若被研究的标志属于品质标志,则把这个总体 称为属性总体。 如反映机器设备的完好情况(完全不完好),反映性别差异的新生婴儿总体, 反映质量好坏的产品总体等。 对于总体按其所包含的单位数多少分为:有限总体、无限总体。 有限总体:总体中所包含的单位数是有限的,变量的取值也是有限的。如一 个工厂的设备、台数,一个国家的人口数等。 无限总体:总体中所包含的单位数有无限多。如自然科学中的实验,它可以 无限次地进行下去,因此,也只能通过抽样取得数据
(二)样本总体(样本、子样) 样本:它是我们所要观察的对象,它是从全及总体中随机抽取出来的,代表 全及总体的那部分单位所组成的整体(小总体)。 例如,从石油大学所有的学生中随机抽取200名学生进行调查;从所有的产 品中随机抽取100件产品进行产品质量检验等,这200名学生、100件产品是样 本 样本个数:从总体中可能抽取的样本数目。 样本容量:样本总体的单位数叫样本容量,通常用n表示。如上例,第一个 样本容量为200,第二个样本容量为100。 由于样本单位数的多少不同:大样本:n≥30;小样本:n<30。 对于一个问题,全及总体是唯一确定的:而样本总体则不然,一个全及总体 可能抽取许多个样本总体。所有样本的可能数目既和样本的容量大小有关,也和 样本的抽取方法有关 、全及指标和抽样指标 (一)全及指标:根据全及总体各个单位的标志值或标志特征计算的,反映 总体某种属性或特征的综合指标叫全及指标,也称它为参数。例如,某企业所有 职工是总体,则该企业的平均工资是一个全及指标,它是根据每个职工的工资计 算的:又如,某个企业报告期所生产的全部产品是总体,则该批产品的合格率就 是全及指标。 个总体常常有多个参数,它们从各个不同的角度反映总体的数量特征。 1.变量总体的全及指标 由于变量总体各单位的标志值可以用数量来表示,所以可以计算全及总体的 平均数x和总体的标准差 X=2X或X ∑F N-o=/2(X-X2F ∑(x-X ∑F 2.属性总体的全及指标 由于各单位的标志不能用数值来表示,而只能用一定的述语来描述,所以, 全及指标常用成数P来表示具有某种属性的单位数占总体单位数的比重;Q表示
(二)样本总体(样本、子样) 样本:它是我们所要观察的对象,它是从全及总体中随机抽取出来的,代表 全及总体的那部分单位所组成的整体(小总体)。 例如,从石油大学所有的学生中随机抽取 200 名学生进行调查;从所有的产 品中随机抽取 100 件产品进行产品质量检验等,这 200 名学生、100 件产品是样 本。 样本个数:从总体中可能抽取的样本数目。 样本容量:样本总体的单位数叫样本容量,通常用 n 表示。如上例,第一个 样本容量为 200,第二个样本容量为 100。 由于样本单位数的多少不同:大样本:n≥30;小样本:n<30。 对于一个问题,全及总体是唯一确定的;而样本总体则不然,一个全及总体 可能抽取许多个样本总体。所有样本的可能数目既和样本的容量大小有关,也和 样本的抽取方法有关。 二、全及指标和抽样指标 (一)全及指标:根据全及总体各个单位的标志值或标志特征计算的,反映 总体某种属性或特征的综合指标叫全及指标,也称它为参数。例如,某企业所有 职工是总体,则该企业的平均工资是一个全及指标,它是根据每个职工的工资计 算的;又如,某个企业报告期所生产的全部产品是总体,则该批产品的合格率就 是全及指标。 一个总体常常有多个参数,它们从各个不同的角度反映总体的数量特征。 1.变量总体的全及指标 由于变量总体各单位的标志值可以用数量来表示,所以可以计算全及总体的 平均数 x和总体的标准差 。 2.属性总体的全及指标 由于各单位的标志不能用数值来表示,而只能用一定的述语来描述,所以, 全及指标常用成数 P 来表示具有某种属性的单位数占总体单位数的比重;Q 表示 X XF 或 X N F X = 2 2 (X X) (X X) F 或σ= N F - - σ=
不具有某种属性的单位数占总体单位数和比重。 P P+O =P P(1-P 全及指标的特点:全及指标所反映的总体范围是确定的,指标的计算方法是 已知的,具体指标数值是唯一的,但却又是未知的,只能通过抽样指标进行推断 估算 (二)抽样指标 根据样本总体中各个单位的标志值或标志特征计算的指标,又被称为统计 例如,石油大学200名学生的平均成绩;从某个企业所生产的所有产品中, 随机抽选出来的100件产品的合格率等就是抽样指标。 和全及指标相对应,抽样指标有抽样平均数x,抽样成数P和样本标准差s。 变量总体 或x ∑(x-x) 属性总体: x-p p=√p(1-p) 抽样指标的特点:随着样本的不同,抽样指标也不同,它是一个随机变量。 但是,当抽定一个样本后,抽样指标是可以计算出来的。(可计算但不唯一) 三、抽样方法和样本的可能数目 从一个总体中可以抽取多少个样本,它既和样本容量有关,也和抽样的方法 有关。当样本的容量一定时,样本的可能数目便取决于抽样的方法。 抽样方法又可以从取样方式和对样本的要求不同等方面来研究。 (一)根据取样方式的不同,抽样方法分为:重复(置)抽样;不重复(置) 抽样 1.重复抽样
不具有某种属性的单位数占总体单位数和比重。 N N P 1 N N Q 1 P Q 1 x P P(1 P) 全及指标的特点:全及指标所反映的总体范围是确定的,指标的计算方法是 已知的,具体指标数值是唯一的,但却又是未知的,只能通过抽样指标进行推断、 估算。 (二)抽样指标 根据样本总体中各个单位的标志值或标志特征计算的指标,又被称为统计 量。 例如,石油大学 200 名学生的平均成绩;从某个企业所生产的所有产品中, 随机抽选出来的 100 件产品的合格率等就是抽样指标。 和全及指标相对应,抽样指标有抽样平均数 x,抽样成数 P 和样本标准差 s。 变量总体: 属性总体: 抽样指标的特点:随着样本的不同,抽样指标也不同,它是一个随机变量。 但是,当抽定一个样本后,抽样指标是可以计算出来的。(可计算但不唯一) 三、抽样方法和样本的可能数目 从一个总体中可以抽取多少个样本,它既和样本容量有关,也和抽样的方法 有关。当样本的容量一定时,样本的可能数目便取决于抽样的方法。 抽样方法又可以从取样方式和对样本的要求不同等方面来研究。 (一)根据取样方式的不同,抽样方法分为:重复(置)抽样;不重复(置) 抽样。 1.重复抽样 x xf x x n f 或 (x x) (x x) f s n f s 2 2 或 n1 x p n s pq p(1 p)