第七章抽样推断(一)教学目的通过本章的学习,掌握抽样基本理论及参数的估计方法,学会对总体参数进行区间估计。(二)基本要求要求掌握抽样调查中的基本概念、抽样估计的基本方法,学会样本统计量的计算方法,并能对总体参数进行估计。(三)教学要点1、不同抽样组织形式的抽样误差计算;2、总体均值及比例的区间估计;3、必要抽样数目的计算方法。(四)本章难点1、如何理解抽样估计的基本理论:2、抽样误差的含义与计算方法:3、不同类型总体的参数区间估计问题。(五)教学时数6 课时(六)教学内容本章共分四节第一节抽样调查的一般问题一、抽样的概念和特点(一)抽样调查的概念抽样调查是一种非全面的调查方法。它既是搜集统计资料的方法,又是对现象总体进行科学估计和判断的方法。所以它不论在统计调查还是在统计分析中都有广泛的应用。抽样调查是按随机原则从全部研究单位中抽取一部分单位进行观察,根据样
第七章 抽样推断 (一)教学目的 通过本章的学习,掌握抽样基本理论及参数的估计方法,学会对总体参数进 行区间估计。 (二)基本要求 要求掌握抽样调查中的基本概念、抽样估计的基本方法,学会样本统计量的 计算方法,并能对总体参数进行估计。 (三)教学要点 1、不同抽样组织形式的抽样误差计算; 2、总体均值及比例的区间估计; 3、必要抽样数目的计算方法。 (四)本章难点 1、如何理解抽样估计的基本理论; 2、抽样误差的含义与计算方法; 3、不同类型总体的参数区间估计问题。 (五)教学时数 6 课时 (六)教学内容 本章共分四节 第一节 抽样调查的一般问题 一、抽样的概念和特点 (一)抽样调查的概念 抽样调查是一种非全面的调查方法。它既是搜集统计资料的方法,又是对现 象总 体进行科学估计和判断的方法。所以它不论在统计调查还是在统计分析中都有广 泛的应用。 抽样调查是按随机原则从全部研究单位中抽取一部分单位进行观察,根据样
本资料计算样本的特征值,然后以样本的特征值,对总体的特征值做出具有一定可靠性的估计和判断,以反映总体的数量特征和数量表现的一种统计方法所谓随机原则,即是在抽取样本时,排除人们主观意图的作用,使得总体中的各单位均以相等的机会被抽中。随机原则又称为等可能性原则。例如,从一定面积的小麦中,通过随机抽样,抽取若干地块实割实测,计算平均亩产,以此来推断全部面积的小麦产量。再如,对一批产品进行质量检查时,从全部产品中随机抽取部分产品进行检测计算合格率,以此来推断全部产品的合格率等等。(二)抽样调查的基本特点1、调查单位的确定是按随机原则从全部总体单位中抽取的。2、用部分单位的指标数值去推断和估计总体指标数值。3、抽样调查中的抽样误差是不可避免的,但在事先是可以计算并加以控制的。二、抽样调查的作用1、有些现象是无法进行全面调查的,为了测算全面资料,必须采用抽样调查的方法。例如,对无限总体不能采用全面调查。另外,有些产品的质量检查具有破坏性,如电视机使用寿命检验,罐头的防腐期限试验,轮胎的里程试验等,这些调查所使用的测试手段对产品具有破坏性,不可能进行全面调查,只能采用抽样调查。2、从理论上讲,有些现象虽然可以进行全面调查,但实际上没有必要或很难办到,也要采用抽样调查。例如,要了解全国城乡人民的家庭生活状况,从理论上讲可以门逐户进行全面调查,但是调查范围太大,调查单位太多,实际上难以办到,也没有必要。采用抽样调查可以节约时间、人力、物力和才力,提高调查结果的时效性,又能达到和全面调查同样的目的和效果。3、抽样调查的结果可以对全面调查的结果进行检查和修正。全面调查涉及面宽工作量大,参加人员多,调查结果容易出现差错。因此,在全面调查(如人口普查)之后进行抽样复查,根据抽查结果计算差错率,并依此为依据检查和修正全面调查结果,从而提高全面调查质量。4、抽样调查可以用于工业生产过程的质量控制。在工业产品成批或大量连续生产过程中,利用抽样调查可以检验生产过程是否正常,及时提高信息,进行质量
本资料计算样本的特征值,然后以样本的特征值,对总体的特征值做出具有一定 可靠性的估计和判断,以反映总体的数量特征和数量表现的一种统计方法。 所谓随机原则,即是在抽取样本时,排除人们主观意图的作用,使得总体中 的各单位均以相等的机会被抽中。随机原则又称为等可能性原则。例如,从一定 面积的小麦中,通过随机抽样,抽取若干地块实割实测,计算平均亩产,以此来 推断全部面积的小麦产量。再如,对一批产品进行质量检查时,从全部产品中随 机抽取部分产品进行检测计算合格率,以此来推断全部产品的合格率等等。 (二)抽样调查的基本特点 1、调查单位的确定是按随机原则从全部总体单位中抽取的。 2、用部分单位的指标数值去推断和估计总体指标数值。 3、抽样调查中的抽样误差是不可避免的,但在事先是可以计算并加以控制的。 二、抽样调查的作用 1、有些现象是无法进行全面调查的,为了测算全面资料,必须采用抽样调查的 方法。例如,对无限总体不能采用全面调查。另外,有些产品的质量检查具有破 坏性,如电视机使用寿命检验,罐头的防腐期限试验,轮胎的里程试验等,这些 调查所使用的测试手段对产品具有破坏性,不可能进行全面调查,只能采用抽样 调查。 2、从理论上讲,有些现象虽然可以进行全面调查,但实际上没有必要或很难办 到,也要采用抽样调查。例如,要了解全国城乡人民的家庭生活状况,从理论上 讲可以挨门逐户进行全面调查,但是调查范围太大,调查单位太多,实际上难以 办到,也没有必要。采用抽样调查可以节约时间、人力、物力和才力,提高调查 结果的时效性,又能达到和全面调查同样的目的和效果。 3、抽样调查的结果可以对全面调查的结果进行检查和修正。全面调查涉及面宽, 工作量大,参加人员多,调查结果容易出现差错。因此,在全面调查(如人口普 查)之后进行抽样复查,根据抽查结果计算差错率,并依此为依据检查和修正全 面调查结果,从而提高全面调查质量。 4、抽样调查可以用于工业生产过程的质量控制。在工业产品成批或大量连续生 产过程中,利用抽样调查可以检验生产过程是否正常,及时提高信息,进行质量
控制,保证生产质量稳定。5、利用抽样调查原理,可以对某些总体的假设进行检验,来判别这种假设的真伪,依决定行动的取舍。例如,某地区去年职工家庭年收入为7200元,本年抽样调查结果表面,职工家庭年收入为7100元,这是否意味着职工生活水平下降呢?我们还不能下这个结论,最好通过假设性检验,检验这两年职工家庭收入是否存在显著性统计差异,才能判断该地区今年职工年收入是否低于去年水平。总之,抽样调查是一种科学实用的调查方法,目前它不仅广泛应用于自然科学领域,也愈来愈多地应用于社会经济现象数量方面的研究。随着抽样理论的发展,抽样技术的进步和完善,广大统计工作者业务水平的提高,抽样调查在社会经济统计中的应用将会愈加普及。三、抽样调查的几个基本概念(一)全及总体和抽样总体全及总体也称为总体或母体,是指所要认识的研究对象的全体,它是由所研究范围内具有某种共同性质的全体单位所组成的集合体。例如,我们要研究某城市职工的生活水平,则该城市全部职工就构成全及总体或总体。在本章用大写的字母N代表全及总体的单位数。抽样总体就是按随机原则从全及总体中抽取的一部分单位组成的小总体。抽样总体简称样本,它也是由许多性质相同的单位组成的。本章中用小写n代表样本的单位数,样本单位数Ⅱ也称为样本容量。组成样本的每个单位称为样本单位。例如,某城市有20万个住户,我们要采用抽样调查的方法研究该城市住户的家庭的收支情况,则该城市全部住户构成全及总体,N=20万。如果从全部住户中随机抽取千分之五即1000户进行调查,则被抽中的1000户构成抽样总体即样本,样本容量n=1000。样本按照样本容量的大小可以分为大样本和小样本。一般地说,n≥30为大样本,n<30为小样本。在对社会经济现象进行抽样调查时,多数采用大样本。应当注意的是,作为抽样推断对象的全及总体是唯一确定的,但作为观察对象的样本就不是唯一的。从一个全及总体中可以抽取很多个样本,每次抽到哪个样本是不确定的。明白这一点对理解抽样推断是很重要的
控制,保证生产质量稳定。 5、利用抽样调查原理,可以对某些总体的假设进行检验,来判别这种假设的真 伪,依决定行动的取舍。例如,某地区去年职工家庭年收入为 7200 元,本年抽 样调查结果表面,职工家庭年收入为 7100 元,这是否意味着职工生活水平下降 呢?我们还不能下这个结论,最好通过假设性检验,检验这两年职工家庭收入是 否存在显著性统计差异,才能判断该地区今年职工年收入是否低于去年水平。 总之,抽样调查是一种科学实用的调查方法,目前它不仅广泛应用于自然科 学领域,也愈来愈多地应用于社会经济现象数量方面的研究。随着抽样理论的发 展,抽样技术的进步和完善,广大统计工作者业务水平的提高,抽样调查在社会 经济统计中的应用将会愈加普及。 三、抽样调查的几个基本概念 (一)全及总体和抽样总体 全及总体也称为总体或母体,是指所要认识的研究对象的全体,它是由所研 究范围内具有某种共同性质的全体单位所组成的集合体。例如,我们要研究某城 市职工的生活水平,则该城市全部职工就构成全及总体或总体。在本章用大写的 字母 N 代表全及总体的单位数。 抽样总体就是按随机原则从全及总体中抽取的一部分单位组成的小总体。抽 样总体简称样本,它也是由许多性质相同的单位组成的。本章中用小写 n 代表样 本的单位数,样本单位数 n 也称为样本容量。组成样本的每个单位称为样本单位。 例如,某城市有 20 万个住户,我们要采用抽样调查的方法研究该城市住户的家 庭的收支情况,则该城市全部住户构成全及总体,N=20 万。如果从全部住户中 随机抽取千分之五即1000户进行调查,则被抽中的1000户构成抽样总体即样本, 样本容量 n=1000。样本按照样本容量的大小可以分为大样本和小样本。一般地 说,n≥30 为大样本,n<30 为小样本。在对社会经济现象进行抽样调查时,多 数采用大样本。 应当注意的是,作为抽样推断对象的全及总体是唯一确定的,但作为观察对 象的样本就不是唯一的。从一个全及总体中可以抽取很多个样本,每次抽到哪个 样本是不确定的。明白这一点对理解抽样推断是很重要的
(二)全及指标和抽样指标1、全及指标又称总体指标全及指标主要有四个:全及平均数、全及成数、总体数量标志的标准差及方差、总体是非标志的标准差及方差。2、抽样指标,又称样本指标。抽样指标有四个对应指标:抽样平均数、抽样成数、样本数量标志标准差及方差、样本是非标志标准差及方差。(三)样本可能数目和抽样方法1、样本可能数目又称样本个数,是指从全及总体中可能抽取或可能构成的样本总体。它既和每个样本的容量有关,也和抽样的方法有关。当样本容量给定时,样本的可能数目便由抽样方法决定。2、抽样方法按抽取样本的方式不同分为重复抽样和不重复抽样。(1)重复抽样。重复抽样是从全及总体中抽取样本时,随机抽取一个样本单位,记录该单位有关标志表现以后,把它放回到全及总体中去,再从全及总体中随机抽取第二个单位,记录它有关标志表现以后,也把它放回全及总体中去,照此下去直到抽选n个样本单位。可见,重复抽样时全及总体单位数在抽选过程中始终没有减少,而且各单位有被重复抽中的可能。(2)不重复抽样。不重复抽样是从全及总体中抽取第一个样本单位,记录该单位有关标志表现后,这个样本单位不再放回全及总体中参加下一次抽选。然后,从总体N-1个单位中随机抽选第二个样本单位,记录了该单位有关标志表现以后,该单位也不再放回全及总体中去,再从全及总体N-2单位中抽选第三个样本单位,照此下去直到抽选出Ⅱ个样本单位。可见,不重复抽样时,总体单位数在抽选过程中是逐渐减少的,而且各单位没有重复被抽中可能两种抽样方法会产生三个差别:①抽取的样本可能数目不同:②抽样误差的计算公式不同③抽样误差的大小不同。四、抽样调查的理论基础抽样调查是建立在概率论大数定律基础是的。大数定律的一系列定理为抽样
(二)全及指标和抽样指标 1、全及指标又称总体指标 全及指标主要有四个:全及平均数、全及成数、总体数量标志的标准差及方 差、总体是非标志的标准差及方差。 2、抽样指标,又称样本指标。 抽样指标有四个对应指标:抽样平均数、抽样成数、样本数量标志标准差及 方差、样本是非标志标准差及方差。 (三)样本可能数目和抽样方法 1、样本可能数目又称样本个数,是指从全及总体中可能抽取或可能构成的样本 总体。它既和每个样本的容量有关,也和抽样的方法有关。当样本容量给定时, 样本的可能数目便由抽样方法决定。 2、抽样方法按抽取样本的方式不同分为重复抽样和不重复抽样。 (1)重复抽样。重复抽样是从全及总体中抽取样本时,随机抽取一个样本单位, 记录该单位有关标志表现以后,把它放回到全及总体中去,再从全及总体中随机 抽取第二个单位,记录它有关标志表现以后,也把它放回全及总体中去,照此下 去直到抽选 n 个样本单位。 可见,重复抽样时全及总体单位数在抽选过程中始终没有减少,而且各单位 有被重复抽中的可能。 (2)不重复抽样。不重复抽样是从全及总体中抽取第一个样本单位,记录该单位 有关标志表现后,这个样本单位不再放回全及总体中参加下一次抽选。然后,从 总体 N-1 个单位中随机抽选第二个样本单位,记录了该单位有关标志表现以后, 该单位也不再放回全及总体中去,再从全及总体 N-2 单位中抽选第三个样本单 位,照此下去直到抽选出 n 个样本单位。 可见,不重复抽样时,总体单位数在抽选过程中是逐渐减少的,而且各单位 没有重复被抽中可能。 两种抽样方法会产生三个差别:①抽取的样本可能数目不同;②抽样误差的 计算公式不同;③抽样误差的大小不同。 四、抽样调查的理论基础 抽样调查是建立在概率论大数定律基础是的。大数定律的一系列定理为抽样
调查提供了数学依据。大数定律是阐明大量随机现象平均结果的稳定性的一系列定理的总称。它说明如果被研究的总体是由大量的相互独立的随机因素所构成,而且每个因素对总体的影响都相对的小。那么将这些大量因素加以平均,因素的个别影响将相互抵消,而呈现出共同作用的影响,使总体具有稳定的性质。第二节抽样误差一、抽样误差的概念(一)抽样误差的一般概念一般地说,抽样误差是指样本指标与被它估计未知的总体参数(总体特征值)之差。具体地是指样本平均数x与总体平均数X的差,样本成数p与总体成数P的差(p-P)。例如,某地区全部小麦平均亩产400公斤,而抽样调查得到的平均亩产为391公斤或403公斤,则样本指标与总体指标之间的误差为-9公斤或3公斤。(二)统计调查误差的种类统计调查误差按产生的原因可以分为登记性误差和代表性误差。二、影响抽样误差的因素1、总体被研究标志的变异程度。2、样本容量的大小,即样本单位数的多少。3、抽样的组织形式。4、抽样的方法。三、抽样平均误差(一)抽样平均误差的意义(二)抽样平均误差的计算我们用希腊字母μ表示抽样平均误差;用ux表示抽样平均指标的抽样平均误差;用up表示抽样成数的抽样平均误差。E(x-X)μ=VK式中:
调查提供了数学依据。 大数定律是阐明大量随机现象平均结果的稳定性的一系列定理的总称。它说明如 果被研究的总体是由大量的相互独立的随机因素所构成,而且每个因素对总体的 影响都相对的小。那么将这些大量因素加以平均,因素的个别影响将相互抵消, 而呈现出共同作用的影响,使总体具有稳定的性质。 第二节抽样误差 一、抽样误差的概念 (一) 抽样误差的一般概念 一般地说,抽样误差是指样本指标与被它估计未知的总体参数(总体特征值)之 差。具体地是指样本平均数 x 与总体平均数 X 的差,样本成数 p 与总体成数 P 的差(p-P)。例如,某地区全部小麦平均亩产 400 公斤,而抽样调查得到的平均 亩产为 391 公斤或 403 公斤,则样本指标与总体指标之间的误差为-9 公斤或 3 公斤。 (二) 统计调查误差的种类 统计调查误差按产生的原因可以分为登记性误差和代表性误差。 二、影响抽样误差的因素 1、总体被研究标志的变异程度。 2、样本容量的大小,即样本单位数的多少。 3、抽样的组织形式。 4、抽样的方法。 三、抽样平均误差 (一) 抽样平均误差的意义 (二) 抽样平均误差的计算 我们用希腊字母μ表示抽样平均误差;用μx 表示抽样平均指标的抽样平均 误差;用μp 表示抽样成数的抽样平均误差。 K x X x − = 2 ( ) 式中: