第一章抽样调查概述 第一节抽样调查的意义和特点 现代社会是高度信息化的社会,大到一个国家或地区范围的经济社会发展战略、发展规 划及各项政策法规的制定,小到一个企业生产经营过程的各种管理决策,都离不开对各种信 息资源的依赖。而信息资源的表现形式又是多种多样的,概括起来大致可分成两大类型, 是定性化的信息,如各种文字性质的消息、新闻、报告等情报材料;二是定量化的信息,如 各种数字性质的图、表等指标资料。前者可借助于各种传播媒体而获取,后者则主要通过统 计调查整理而形成。抽样调査是现代统计调查中最常用的基本方法之一。 、抽样调查的概念 关于抽样调查的定义大体上可以区分成广义和狭义两种,广义的抽样调查包括非概率抽 样与概率抽样,狭义概念仅指概率抽样。本书取狭义的理解,将抽样调查定义为是按照一定 的程序和方法,从所要研究现象的总体中根据随机原则抽取一部分单位组成样本,通过对样 本的调查,获得样本资料,计算出有关的样本指标(统计量),依一整套专门的方法据以对相 应的总体指标(参数)作出估计和推算,并有效控制抽样误差的一种统计方法。抽样调查所依 据的概率原理属于数理统计学的一个重要分支,也是现代统计学的基础。抽样的方法不仅对 统计推断、统计检验以及统计决策等理论的发展产生了直接的影响,而且还构成了其他应用 性学科如计量经济学、管理会计学等的方法论基础 所谓随机原则就是在抽选调查单位的过程中,完全排除人为的主观因素的干扰,以保证 使现象总体中的每一个个体都有一定的可能性被选中。换句话讲,哪些单元能够被选作调查 单位纯属偶然因素的影响所致。这里需说明几点:①随机并非“随意”。随机是有严格的科学 含义的,可用概率来描述,而“随便”仍带有人为的或主观的因素,它不是一个科学的概念 ②随机原则不等于等概率原则:③随机原则一般要求总体中每个单元均有一个非零的概率被 抽中;④抽样概率对总体参数的估计有影响。同时,按随机原则抽样可以保证被抽中的单元 在总体中均匀分布,不致出现系统性、倾向性偏差:在随机原则下,当抽样数目达到足够多 时,样本就会遵从大数定律而呈正态分布,样本单位的标志值才具有代表性,其平均值才会 接近总体平均值;按随机原则抽样,才可能实现计算和控制抽样误差的目的。因此,随机原 则是抽样调查所必须遵循的基本原则。 在这里,“可能性”就是常说的机会,对“可能性”大小所作的数值度量在数理统计学中 被称作概率,它常常是用统计的频率来近似度量的 二、抽样调查的阶段划分与职业规范 由上述抽样调查的概念出发,我们可以将抽样调查工作的全过程划分成三个不同的阶段。 第一阶段为抽样设计阶段,即从现象总体中抽选样本的阶段。在这一过程中,要在对现 象总体进行初步分析的基础之上编制出尽可能完善的抽样框,选择最适合的抽样方式方法, 确定出最佳的样本容量,以充分保证所选样本对整个总体的代表性,从而增强抽样推断的效 果。同时,还要作好问卷设计和试调查等 第二阶段为调查阶段,即对所选中的样本进行调查,搜集样本资料的阶段。在这一过程 中,要解决好调査具体方法的选择,即确定是用走访调査、电话调査、邮寄调査,还是其他 有关方法以搜集所需资料,还要设计出对拒访和无回答(包括样品无回答和项目无回答)的 预防和处理措施,以及对数据质量的检査、控制措施与评价方法等内容。其基本目标是获取 准确的资料,为抽样推断的可靠性打下基础 第三阶段为数据处理和估计推断阶段,即依样本资料对所需要的总体资料进行科学地估 计推算的阶段,是抽样调查工作的最后一个、同时也是最重要的一个阶段。在这一阶段,涉
第一章 抽样调查概述 第一节 抽样调查的意义和特点 现代社会是高度信息化的社会,大到一个国家或地区范围的经济社会发展战略、发展规 划及各项政策法规的制定,小到一个企业生产经营过程的各种管理决策,都离不开对各种信 息资源的依赖。而信息资源的表现形式又是多种多样的,概括起来大致可分成两大类型,一 是定性化的信息,如各种文字性质的消息、新闻、报告等情报材料;二是定量化的信息,如 各种数字性质的图、表等指标资料。前者可借助于各种传播媒体而获取,后者则主要通过统 计调查整理而形成。抽样调查是现代统计调查中最常用的基本方法之一。 一、抽样调查的概念 关于抽样调查的定义大体上可以区分成广义和狭义两种,广义的抽样调查包括非概率抽 样与概率抽样,狭义概念仅指概率抽样。本书取狭义的理解,将抽样调查定义为是按照一定 的程序和方法,从所要研究现象的总体中根据随机原则抽取一部分单位组成样本,通过对样 本的调查,获得样本资料,计算出有关的样本指标(统计量),依一整套专门的方法据以对相 应的总体指标(参数)作出估计和推算,并有效控制抽样误差的一种统计方法。抽样调查所依 据的概率原理属于数理统计学的一个重要分支,也是现代统计学的基础。抽样的方法不仅对 统计推断、统计检验以及统计决策等理论的发展产生了直接的影响,而且还构成了其他应用 性学科如计量经济学、管理会计学等的方法论基础。 所谓随机原则就是在抽选调查单位的过程中,完全排除人为的主观因素的干扰,以保证 使现象总体中的每一个个体都有一定的可能性被选中。换句话讲,哪些单元能够被选作调查 单位纯属偶然因素的影响所致。这里需说明几点:①随机并非“随意”。随机是有严格的科学 含义的,可用概率来描述,而“随便”仍带有人为的或主观的因素,它不是一个科学的概念; ②随机原则不等于等概率原则;③随机原则一般要求总体中每个单元均有一个非零的概率被 抽中;④抽样概率对总体参数的估计有影响。同时,按随机原则抽样可以保证被抽中的单元 在总体中均匀分布,不致出现系统性、倾向性偏差;在随机原则下,当抽样数目达到足够多 时,样本就会遵从大数定律而呈正态分布,样本单位的标志值才具有代表性,其平均值才会 接近总体平均值;按随机原则抽样,才可能实现计算和控制抽样误差的目的。因此,随机原 则是抽样调查所必须遵循的基本原则。 在这里,“可能性”就是常说的机会,对“可能性”大小所作的数值度量在数理统计学中 被称作概率,它常常是用统计的频率来近似度量的。 二、抽样调查的阶段划分与职业规范 由上述抽样调查的概念出发,我们可以将抽样调查工作的全过程划分成三个不同的阶段。 第一阶段为抽样设计阶段,即从现象总体中抽选样本的阶段。在这一过程中,要在对现 象总体进行初步分析的基础之上编制出尽可能完善的抽样框,选择最适合的抽样方式方法, 确定出最佳的样本容量,以充分保证所选样本对整个总体的代表性,从而增强抽样推断的效 果。同时,还要作好问卷设计和试调查等。 第二阶段为调查阶段,即对所选中的样本进行调查,搜集样本资料的阶段。在这一过程 中,要解决好调查具体方法的选择,即确定是用走访调查、电话调查、邮寄调查,还是其他 有关方法以搜集所需资料,还要设计出对拒访和无回答(包括样品无回答和项目无回答)的 预防和处理措施,以及对数据质量的检查、控制措施与评价方法等内容。其基本目标是获取 准确的资料,为抽样推断的可靠性打下基础。 第三阶段为数据处理和估计推断阶段,即依样本资料对所需要的总体资料进行科学地估 计推算的阶段,是抽样调查工作的最后一个、同时也是最重要的一个阶段。在这一阶段,涉
及到对推断总体资料的各种方法(估计量)进行比较、选择,估计误差的计算与控制,缺失 数据的处理,以及进行数据分析,得出分析结果。其核心是不断提高推断结果的可靠性,圆 满完成抽样调查的各项任务 这表明,抽样调查工作的出发点是现象的总体,其目的也是要了解总体的有关方面特征, 但在具体认识过程中是以样本作为核心的,绝大部分的工作也是围绕样本展开的。然其工作 的结果绝不仅仅停留在对样本的认识之上,而是最终上升到对整个总体的更高层次的认识和 把握,也就是以总体作为全部工作的归宿点。 另外任何工作都有一定的职业规范,抽样调査也不例外。在抽样调查中,首先,要注意 尊重并保护被调査者的隐私杈,调査结果只能用于综合分析,而不应给被调査者造成不必要 的麻烦和伤害。其次,要诚实地分析调查资料,不能为得出某个事先期望的结论而随意地改 动资料。第三,要做一个具有职业水平的工作者,做出来的东西既要有能让普通人看懂的主 要信息,也要有能让专家看出其内涵的内容。第四,当从有些调查结果得不出好的结论时, 应诚实地加以说明,而不应含糊其词。最后,抽样调查必须在国家法律法规所允许的范围内 进行,不做违反社会公众利益的调查 三、抽样调查的特点 抽样调查作为一种非全面调查方法,同全面调查相比,具有一系列特点,即使同其他的 各种非全面调查比较,它仍呈现出明显的特色 首先,按随机原则抽选调査单位是抽样调查的一大特色。同属非全面调查的典型调查和 重点调査,在调査单位的具体选定过程中,都程度不同地受到了调查组织者的主观意识的影 响,因而带有一定的随意性,由此使得典型调查和重点调查的科学性受到影响。而抽样调查 按随机原则抽选调查单位,则完全排除了主观意识的干扰,使调查单位的选择建立在较为客 观的基础之上,从而确立了它的科学性。因此,按随机原则抽样既是抽样调查的特色所在, 同时又是其取得成功的基本保证 其次,可以用样本资料推断总体资料是抽样调查的又一基本特征。由前面的分析可知 用样本推断总体是抽样调査的一个重要阶段,实质上这也是进行抽样调查的最终目的之所在。 能够用样本资料推断总体资料的重要意义在于,我们可以通过对部分单位的调査,以少量的 投入,即可取得以前只能用普査才能取得的同样的效果,得到所希望了解的现象总体的全面 资料,从而节约大量的调査费用,这也是抽样调查得以广泛应用的重要原因之 其三,抽样调査的速度快、周期短、精度高。由于只调査一部分单位的情况,因此其调 查登记及汇总处理的工作量较之全面调查要小得多,所需时间也大大缩短,这为调查速度的 加快创造了十分有利的条件,由此调查的时效性得以加强。同时,在调查单位减少后,由于 工作量相应地减少,则可以较严格地挑选和培训调査员,调査和数据处理的质量比较容易控 制,因此可能取得更准确的结果。所以,更能满足统计调査的及时性和准确性要求 其四,在抽样推断之前可以计算和控制抽样误差。随着抽样推断理论的不断发展,误差 分布理论日趋成熟,与此同时,抽样误差计算和控制的方法也逐步得以完善,而且关于抽样 调查的误差问题的讨论也扩展到了对具有更为广泛意义的非抽样误差的深入研究。这是抽样 调查的又一重要特色 其五,抽样技术灵活多样。在过去短短的几十年时间里,抽样调查在其理论飞速发展的 同时,抽样技术也得到了长足的发展,至今已形成了较为完整的抽样技术体系。各种不同的 抽样技术可以分别适用于不同现象的抽样过程,也可在同一现象的抽样中结合运用,从而保 证获得最好的抽样效果 其六,抽样调査的应用十分广泛。无论是对社会现象的调查、还是经济问题的研究,或 者是自然现象的了解,都可以使用抽样调查方法。可以毫不夸张地讲,凡是可以运用全面调 查的场合,都可以使用抽样调查,凡不能使用全面调查的场合,一般也能利用抽样调查方法
及到对推断总体资料的各种方法(估计量)进行比较、选择,估计误差的计算与控制,缺失 数据的处理,以及进行数据分析,得出分析结果。其核心是不断提高推断结果的可靠性,圆 满完成抽样调查的各项任务。 这表明,抽样调查工作的出发点是现象的总体,其目的也是要了解总体的有关方面特征, 但在具体认识过程中是以样本作为核心的,绝大部分的工作也是围绕样本展开的。然其工作 的结果绝不仅仅停留在对样本的认识之上,而是最终上升到对整个总体的更高层次的认识和 把握,也就是以总体作为全部工作的归宿点。 另外任何工作都有一定的职业规范,抽样调查也不例外。在抽样调查中,首先,要注意 尊重并保护被调查者的隐私权,调查结果只能用于综合分析,而不应给被调查者造成不必要 的麻烦和伤害。其次,要诚实地分析调查资料,不能为得出某个事先期望的结论而随意地改 动资料。第三,要做一个具有职业水平的工作者,做出来的东西既要有能让普通人看懂的主 要信息,也要有能让专家看出其内涵的内容。第四,当从有些调查结果得不出好的结论时, 应诚实地加以说明,而不应含糊其词。最后,抽样调查必须在国家法律法规所允许的范围内 进行,不做违反社会公众利益的调查。 三、抽样调查的特点 抽样调查作为一种非全面调查方法,同全面调查相比,具有一系列特点,即使同其他的 各种非全面调查比较,它仍呈现出明显的特色。 首先,按随机原则抽选调查单位是抽样调查的一大特色。同属非全面调查的典型调查和 重点调查,在调查单位的具体选定过程中,都程度不同地受到了调查组织者的主观意识的影 响,因而带有一定的随意性,由此使得典型调查和重点调查的科学性受到影响。而抽样调查 按随机原则抽选调查单位,则完全排除了主观意识的干扰,使调查单位的选择建立在较为客 观的基础之上,从而确立了它的科学性。因此,按随机原则抽样既是抽样调查的特色所在, 同时又是其取得成功的基本保证。 其次,可以用样本资料推断总体资料是抽样调查的又一基本特征。由前面的分析可知, 用样本推断总体是抽样调查的一个重要阶段,实质上这也是进行抽样调查的最终目的之所在。 能够用样本资料推断总体资料的重要意义在于,我们可以通过对部分单位的调查,以少量的 投入,即可取得以前只能用普查才能取得的同样的效果,得到所希望了解的现象总体的全面 资料,从而节约大量的调查费用,这也是抽样调查得以广泛应用的重要原因之一。 其三,抽样调查的速度快、周期短、精度高。由于只调查一部分单位的情况,因此其调 查登记及汇总处理的工作量较之全面调查要小得多,所需时间也大大缩短,这为调查速度的 加快创造了十分有利的条件,由此调查的时效性得以加强。同时,在调查单位减少后,由于 工作量相应地减少,则可以较严格地挑选和培训调查员,调查和数据处理的质量比较容易控 制,因此可能取得更准确的结果。所以,更能满足统计调查的及时性和准确性要求。 其四,在抽样推断之前可以计算和控制抽样误差。随着抽样推断理论的不断发展,误差 分布理论日趋成熟,与此同时,抽样误差计算和控制的方法也逐步得以完善,而且关于抽样 调查的误差问题的讨论也扩展到了对具有更为广泛意义的非抽样误差的深入研究。这是抽样 调查的又一重要特色。 其五,抽样技术灵活多样。在过去短短的几十年时间里,抽样调查在其理论飞速发展的 同时,抽样技术也得到了长足的发展,至今已形成了较为完整的抽样技术体系。各种不同的 抽样技术可以分别适用于不同现象的抽样过程,也可在同一现象的抽样中结合运用,从而保 证获得最好的抽样效果。 其六,抽样调查的应用十分广泛。无论是对社会现象的调查、还是经济问题的研究,或 者是自然现象的了解,都可以使用抽样调查方法。可以毫不夸张地讲,凡是可以运用全面调 查的场合,都可以使用抽样调查,凡不能使用全面调查的场合,一般也能利用抽样调查方法
进行调查研究。关于抽样的具体应用情况在后面有关章节的论述中还要进一步涉及,在此从 最后,同其他调查方式相比,抽样调查的技术性更强,因此,一般需要有统计学的专家 作指导,并且要求统计专家不仅要有适当的抽样理论方面的知识,还应有抽样的实践经验。 四、抽样调查的作用 抽样调查除具有十分明显的特色之外,还在实际应用过程中发挥着突出的作用。 其一,抽样调査能够解决全面调査所无法解决的现象的调査问题。在实际工作中,对某 些现象常常可能一方面需要了解其全面情况,另一方面又由于现象自身的特性决定了无法通 过全面调査获取资料。此时,只有使用抽样调査。该类现象主要有:(1)产品质量的破坏性检 验。如轮胎的里程寿命试验,青砖的抗折耐压试验,炮弹的杀伤力试验,弹簧的抗拉强度试 验等等。(2)无限总体的调查:无限总体因其所包含的总体单位数目是无限多个,故无法 计量。如宇宙空间的星球数目、人体的细胞数目等等。(3)包括未来时序的总体,如生产过程 稳定性的检查等 其二,抽样调查适用于对理论上可以作全面调查,而实际上又难以组织全面调查的现象 进行调查。有些现象虽属于有限总体,但由于其总体范围过大,单位数目过多且过于分散, 事实上不可能作全面调查,如森林的木材蓄积量调查,大量连续作业的某些产品质量的非破 坏性检验,水稻的个粒重检验等等。还有些现象由于受时间或其他条件的制约,不能组织全 面调查,如战备物资调査,自然灾害造成损失情况的调査等等。 其三,抽样调査对于时效性要求较高、同时又可以不作全面调査的现象的调查有着特殊 的作用。如前所述,抽样调查具有费用低、速度快、精度高的特点,这使得它比其它非全面 调查能更有效地满足各有关方面的需要 其四,抽样调査的结果可被用来检验和修正全面调查结果。任何调査都可能存在误差, 全面调查也不例外。而且由于全面调查涉及面广、工作量大、参加人员多、汇总传递环节多 调査结果容易出现差错。但是,其差错到底有多大,全面调査自身无法回答这一问题。因此, 可在全面调査之后再进行一次抽样调查,根据抽样调査结果对全面调查结果进行检査和修正, 从而提高全面调查的质量 其五,抽样调査可对工业生产过程的稳定性进行监测,从而实现质量控制。在工业产品 成批或大量连续生产过程中,利用抽样调查方法对产品的质量进行动态检测,及时提供有关 信息,变事后监督为事中控制,并通过编制质量控制图开展监控,是世界上许多国家广泛采 用的工业产品质量控制系统。这一应用不仅对于生产过程的控制意义重大,而且也为进一步 推广抽样调查,乃至于整个统计方法的应用,提供了成功的范例,积累了可贵的经验,并产 生了深远的影响。本书第十三章讨论了有关这方面的内容。 其六,利用抽样调査方法还可以对总体的某些假设进行检验,以判断这些假设的真伪 为管理决策提供依据。例如:一种新药在对某患者使用后效果不错,这是否意味着这种新药 的疗效就一定显著呢?单凭此还不能做出结论。因为疗效对于每个人常会受到一些随机因素 的影响而呈现出一定的不确定性。因此,最好利用抽样调查结果,对这种药物的疗效是否存 在显著性的统计差异进行检验,以确定其疗效状况,并据此作出是否推广使用该药的决策。 利用抽样调查方法研究人们未来的行动决策,这是抽样方法应用上的又一重要突破 第二节抽样调查的历史发展及应用 抽样调查成为一种科学方法,是本世纪的事,然而这种统计方法的实质,人类早在实践 中已经体会到。只是由于历史条件的限制,在十九世纪末叶以前,抽样调查在统计实践中很 少运用。后来由于人们认识到了它的适宜于实践运用与理论分析、兼顾统计效果与经济效果 等优点以及推断统计理论的成熟,抽样调查才逐渐得到广泛的使用
进行调查研究。关于抽样的具体应用情况在后面有关章节的论述中还要进一步涉及,在此从 略。 最后,同其他调查方式相比,抽样调查的技术性更强,因此,一般需要有统计学的专家 作指导,并且要求统计专家不仅要有适当的抽样理论方面的知识,还应有抽样的实践经验。 四、抽样调查的作用 抽样调查除具有十分明显的特色之外,还在实际应用过程中发挥着突出的作用。 其一,抽样调查能够解决全面调查所无法解决的现象的调查问题。在实际工作中,对某 些现象常常可能一方面需要了解其全面情况,另一方面又由于现象自身的特性决定了无法通 过全面调查获取资料。此时,只有使用抽样调查。该类现象主要有:(1)产品质量的破坏性检 验。如轮胎的里程寿命试验,青砖的抗折耐压试验,炮弹的杀伤力试验,弹簧的抗拉强度试 验等等。(2)无限总体的调查:无限总体因其所包含的总体单位数目是无限多个,故无法一一 计量。如宇宙空间的星球数目、人体的细胞数目等等。(3)包括未来时序的总体,如生产过程 稳定性的检查等。 其二,抽样调查适用于对理论上可以作全面调查,而实际上又难以组织全面调查的现象 进行调查。有些现象虽属于有限总体,但由于其总体范围过大,单位数目过多且过于分散, 事实上不可能作全面调查,如森林的木材蓄积量调查,大量连续作业的某些产品质量的非破 坏性检验,水稻的个粒重检验等等。还有些现象由于受时间或其他条件的制约,不能组织全 面调查,如战备物资调查,自然灾害造成损失情况的调查等等。 其三,抽样调查对于时效性要求较高、同时又可以不作全面调查的现象的调查有着特殊 的作用。如前所述,抽样调查具有费用低、速度快、精度高的特点,这使得它比其它非全面 调查能更有效地满足各有关方面的需要。 其四,抽样调查的结果可被用来检验和修正全面调查结果。任何调查都可能存在误差, 全面调查也不例外。而且由于全面调查涉及面广、工作量大、参加人员多、汇总传递环节多、 调查结果容易出现差错。但是,其差错到底有多大,全面调查自身无法回答这一问题。因此, 可在全面调查之后再进行一次抽样调查,根据抽样调查结果对全面调查结果进行检查和修正, 从而提高全面调查的质量。 其五,抽样调查可对工业生产过程的稳定性进行监测,从而实现质量控制。在工业产品 成批或大量连续生产过程中,利用抽样调查方法对产品的质量进行动态检测,及时提供有关 信息,变事后监督为事中控制,并通过编制质量控制图开展监控,是世界上许多国家广泛采 用的工业产品质量控制系统。这一应用不仅对于生产过程的控制意义重大,而且也为进一步 推广抽样调查,乃至于整个统计方法的应用,提供了成功的范例,积累了可贵的经验,并产 生了深远的影响。本书第十三章讨论了有关这方面的内容。 其六,利用抽样调查方法还可以对总体的某些假设进行检验,以判断这些假设的真伪, 为管理决策提供依据。例如:一种新药在对某患者使用后效果不错,这是否意味着这种新药 的疗效就一定显著呢?单凭此还不能做出结论。因为疗效对于每个人常会受到一些随机因素 的影响而呈现出一定的不确定性。因此,最好利用抽样调查结果,对这种药物的疗效是否存 在显著性的统计差异进行检验,以确定其疗效状况,并据此作出是否推广使用该药的决策。 利用抽样调查方法研究人们未来的行动决策,这是抽样方法应用上的又一重要突破。 第二节 抽样调查的历史发展及应用 抽样调查成为一种科学方法,是本世纪的事,然而这种统计方法的实质,人类早在实践 中已经体会到。只是由于历史条件的限制,在十九世纪末叶以前,抽样调查在统计实践中很 少运用。后来由于人们认识到了它的适宜于实践运用与理论分析、兼顾统计效果与经济效果 等优点以及推断统计理论的成熟,抽样调查才逐渐得到广泛的使用
、抽样调查的历史发展 关于抽样调查的历史发展,可分三个不同的时间段进行考察。 1、1895年以前。抽样调査处在实践探索过程和萌芽阶段。 原始的抽样法,在人类活动中早就使用过,如古代中国人、古希腊人就知道从整体中取 出一小部分予以审味和检验,以确定物体的性质。这种平凡的举动,可以说在有文字记载的 历史以前就已存在。而有文字保留下来可以作为佐证的最早记载,则是俄国一个名叫莫罗佐 夫的贵族在1648年的庄园“记事”中,曾经讲到如何简单地运用样本田的产量来估算庄园的 总收获量 其后,政治算术学派的学者们在研究中广泛采用样本资料进行总体推算。如英国的威 廉·配第( Willian Petty)用死亡人数和瘟疫流行年份死于鼠疫的人数等,对伦敦居民人数进 行推算,或从伦敦的房屋栋数、每栋房屋平均家庭数以及每个家庭的平均人数,推算伦敦的 居民人数。格朗特( John Graunt)以伦敦市的人口为基础,研究人口现象运动的规律。荷兰的 威特( Johan de Wit)曾根据对数千人的死亡年龄进行计算,得出了人口的死亡率。凯尔斯勃 (w. Kersseboom)曾估算荷兰的人口总数和各年龄的死亡人数,从而编制出荷兰寿命表。法国 的沃邦( Vauban)推算过全国土地面积和人口总数。拉瓦锡( Antoine laurent lavoisier)从生 产、消费与收入方面推算法国国民收入。瑞典的埃尔威斯( Pehr elvis)在人口保持平衡的假 设下,估算出全国人口数,并编成瑞典出生死亡表。瓦尔格廷( Per Wargentin)通过对历史人 口和当时人口的出生死亡记录的观察,编制成全国死亡率表。俄国的盖尔曼推算过全国农业、 工业产量和消费总额。 1766年,法国经济学家麦桑斯( Messance)在其所著《法国人口论》一书中,以部分地区 的人口清查数字为依据,推算全国人口数。1778年,法国另一位经济学家摩休(M. Moreau)在 其《法国人口研究论述》一书中,也发表了依样本出生率和死亡率推算出来的法国人口估计 数。1800年,经商出身的英国经济学家伊顿( Frederic morton eden)在《英国居民人数的估 十》中,利用平均每户居民数,出生人数以及住宅数的样本资料,估算出大不列颠的人口总 数,他的估计被第二年英国的第一次人口普查结果所证实 法国的数学家、统计学家拉普拉斯( Pierre Simon Laplace)于1786年在一篇关于巴黎人 口的出生、婚姻、死亡的文章中,提出根据法国特定地方的出生率来推算全国人口数。他的 建议得到法国新政府的支持。于是他在全国抽选了30个郡,共2037615人,于1802年9月 22日进行深入调查,调查发现平均每28.352845个居民每年出生一个婴儿,并由此推算出全 国总人口数为42529267人。这是由特定区域的人口数与出生率为依据,推算出全国人口数的 方法。尽管这种推算是有问题的,但这件事,在当时条件下,无论对人口统计还是对统计方 法论来说,都是一个巨大的创造。在统计发展史上,他首创用样本来推断总体的思想(即大样 本统计推断),为后人开创了一条局部调查的新路子,对以后抽样调查的形成和发展也产生了 巨大的影响。因此,丹麦统计学家韦斯特加德(H.L. Westergaard)认为:“现代代表统计学 就是以选择出的部分资料(样本)为基础,而推导出全部资料的计算结果(抽样法),实际上 是以拉普拉斯为嚆失的。” 1835年,著名统计学家、比利时的凯特勒( Lambert Adolphe jacques Quetelet)根据所 搜集关于165个剧本的47位法国作家的资料,研究了写作与年龄的关系。最后得出的结论是 剧本的创作才能出现在21岁以后,30~35岁是精力旺盛时期,50~55岁是成熟时期,此后 便日渐衰退一一—特别是在剧本的价值方面。在这里,他所使用的研究方法实际上就是抽样方 1846年,俄国数学家奥斯特罗格拉茨基院士发表论文,主张在产品质量检验中用抽样法, 这样可节省95%的繁重工作。 1846年至1847年,英国农场主莱威斯( John Lawes)与青年农业技师吉尔贝特(Heny
一、抽样调查的历史发展 关于抽样调查的历史发展,可分三个不同的时间段进行考察。 1、1895 年以前。抽样调查处在实践探索过程和萌芽阶段。 原始的抽样法,在人类活动中早就使用过,如古代中国人、古希腊人就知道从整体中取 出一小部分予以审味和检验,以确定物体的性质。这种平凡的举动,可以说在有文字记载的 历史以前就已存在。而有文字保留下来可以作为佐证的最早记载,则是俄国一个名叫莫罗佐 夫的贵族在 1648 年的庄园“记事”中,曾经讲到如何简单地运用样本田的产量来估算庄园的 总收获量。 其后,政治算术学派的学者们在研究中广泛采用样本资料进行总体推算。如英国的威 廉·配第(Willian Petty)用死亡人数和瘟疫流行年份死于鼠疫的人数等,对伦敦居民人数进 行推算,或从伦敦的房屋栋数、每栋房屋平均家庭数以及每个家庭的平均人数,推算伦敦的 居民人数。格朗特(John Graunt)以伦敦市的人口为基础,研究人口现象运动的规律。荷兰的 威特(Joham de Witt)曾根据对数千人的死亡年龄进行计算,得出了人口的死亡率。凯尔斯勃 (W.Kersseboom)曾估算荷兰的人口总数和各年龄的死亡人数,从而编制出荷兰寿命表。法国 的沃邦(Vauban)推算过全国土地面积和人口总数。拉瓦锡(Antoine Laurent Lavoisier)从生 产、消费与收入方面推算法国国民收入。瑞典的埃尔威斯(Pehr Elvius)在人口保持平衡的假 设下,估算出全国人口数,并编成瑞典出生死亡表。瓦尔格廷(Per Wargentin)通过对历史人 口和当时人口的出生死亡记录的观察,编制成全国死亡率表。俄国的盖尔曼推算过全国农业、 工业产量和消费总额。 1766 年,法国经济学家麦桑斯(Messance)在其所著《法国人口论》一书中,以部分地区 的人口清查数字为依据,推算全国人口数。1778 年,法国另一位经济学家摩休(M.Moheau)在 其《法国人口研究论述》一书中,也发表了依样本出生率和死亡率推算出来的法国人口估计 数。1800 年,经商出身的英国经济学家伊顿(Frederic Morton Eden)在《英国居民人数的估 计》中,利用平均每户居民数,出生人数以及住宅数的样本资料,估算出大不列颠的人口总 数,他的估计被第二年英国的第一次人口普查结果所证实。 法国的数学家、统计学家拉普拉斯(Pierre Simon Laplace)于 1786 年在一篇关于巴黎人 口的出生、婚姻、死亡的文章中,提出根据法国特定地方的出生率来推算全国人口数。他的 建议得到法国新政府的支持。于是他在全国抽选了 30 个郡,共 2037615 人,于 1802 年 9 月 22 日进行深入调查,调查发现平均每 28.352845 个居民每年出生一个婴儿,并由此推算出全 国总人口数为 42529267 人。这是由特定区域的人口数与出生率为依据,推算出全国人口数的 方法。尽管这种推算是有问题的,但这件事,在当时条件下,无论对人口统计还是对统计方 法论来说,都是一个巨大的创造。在统计发展史上,他首创用样本来推断总体的思想(即大样 本统计推断),为后人开创了一条局部调查的新路子,对以后抽样调查的形成和发展也产生了 巨大的影响。因此,丹麦统计学家韦斯特加德(H.L.Westergaard)认为:“现代代表统计学 就是以选择出的部分资料(样本)为基础,而推导出全部资料的计算结果(抽样法),实际上 是以拉普拉斯为嚆失的。” 1835 年,著名统计学家、比利时的凯特勒(Lambert Adolphe Jacques Quetelet)根据所 搜集关于 165 个剧本的 47 位法国作家的资料,研究了写作与年龄的关系。最后得出的结论是: 剧本的创作才能出现在 21 岁以后,30~35 岁是精力旺盛时期,50~55 岁是成熟时期,此后 便日渐衰退——特别是在剧本的价值方面。在这里,他所使用的研究方法实际上就是抽样方 法。 1846 年,俄国数学家奥斯特罗格拉茨基院士发表论文,主张在产品质量检验中用抽样法, 这样可节省 95%的繁重工作。 1846 年至 1847 年,英国农场主莱威斯(John Lawes)与青年农业技师吉尔贝特(Heny
Gilbert)在卢桑姆斯坦特德农业实验站设置样本区,来试验过磷酸盐与氮肥等各种化学肥料 对收获量的影响。直到1879年,他们根据五块地段(33英亩)的小麦产量来估计全部英格兰 与威尔士从1852年至1879年每亩产量的变化。1866年,俄国的拉扎列夫斯基通过样本调查, 对典型农户的家庭收入作了详细观察。 在抽样调查的实践方面,美国的赖特( Ccrrdl Davidson Wright)的贡献是值得一提的。 他主要领导举办了这样几次调查:①1873年,根据贫民生活改善协会400个志愿调查员的报 告,估计了纽约市的失业人数;②1873~1879年经济危机时期,他借助于马萨诸塞州19个 城市的警察署和与375个城镇的财产评估人员的通信,查询失业人数,他估计失业者为28,508 人,纠正了当时对失业人数过高的估计。③20世纪初,马萨诸塞州一年一次的工商业抽样调 查,以及此后举办的两年一次的全国工商业抽样调查也是在赖特领导下举办的。赖特从事抽 样调查的实际经验,后来给凯尔倡导的代表性调查给予了有力的支持 在抽样调查发展史上,挪威的凯尔( Anders nicolai kiaer)是一个划时代的人物。他对 抽样调查的贡献,无论是在实践还是在理论方面,就当时的条件而言,都是十分卓越的。因 此,马来西亚统计学家尤葆生( You Poh seng)在《抽样理论与实践发展的历史的考察》一文 中评价到:“凯尔的工作,可以视为统计学史上的一个转折点。他是离开人口普查而用抽样方 法搜集社会资料的第一人,并为抽样理论奠定了基础。”凯乐所组织的抽样调査实践中,比较 有影响的有:①1891年的挪威国民收入与财富的代表性调查。在这次调查中,可能代表全国 国民收入和财富情况的许多城市、乡区和村落被选出来。在这些区域内按某个年龄、各种社 会阶层、各种婚姻情况以及某种字母起首姓名等标识,把居民的有关情况详细记录下来,从 这些记录来推断出挪威全国国民收入和财富。②1894年,他主持在挪威全国范围进行关于劳 工退休年金和疾病保险制度的抽样调查,是抽样调查史上一次成功的先例。这次调查根据 1891年的人口普查资料确定比例,在城乡分别采用不同的抽取方法抽查了2万人和6万人进 行调查,并且特别强调了所抽选人口的分布状况以增强其代表性。③1895年,为弄清挪威成 年男子的收入按不同的职业、年龄和社会地位的分布情况,凯尔和汉森(E. Hanssen)等组织了 抽样调查 以上列举的事实表明,在1895年以前,抽样调查的实践应用已经在许多领域展开,这些 都为抽样调查的进一步发展创造了条件,积累了宝贵经验。但这时的抽样调查仍处于探索过 程之中,没有形成系统的理论,也没有得到普遍的认可。因此,德国统计学家詹森(A. Jenson) 认为:“到十九世纪最后十年的中期为止,也就是到1895年为止,抽样调查在实际中几乎并 未实行过。”理由是象尤葆生所指出的:“那时负责使用这种方法的统计学家们,既不说明他 们如何抽取样本,也不提所遭遇的困难,以及克服这些困难应采取的途径,由于这些事实, 我们就无法决定是否可以把它们恰当地称为抽样调查 2、1895~1925年。抽样调查逐步得以确认的过程。 凯尔在坚持抽样调査实践的同时,还十分注意对抽样调査的方法和理论进行硏究。总结 实践经验,他认为,一次成功的抽样调查应具备两个条件,即正确的代表性和单位的合理选 择。因为“调查结果的准确性,不取决于观察数量的多寡,而取决于取得正确代表性的方法 1895年,国际统计学会(ISI)在瑞士首都伯尔尼召开第五次大会。会上,凯尔提出关 于代表性调查的报告——《对代表性调查的研究和经验》,试图阐明代表性调查的意义,在于 搜集非普査所能提供的详细资料。但同时他也十分小心地强调指出,他并无把这种调查作为 普査或任何通常的调査之意,更无认为这种调査可以取代普査之意,他只是想用“代表性调 查”来表示某种特殊类型的调查而已。他将代表性调查定义为“根据抽样设计,从总体的正 常‘代表’中合理地收集数据”,他强调所调查的样本应是总体的一个“代表”。在这次大会 上,围绕着凯尔的报告,出现了激烈的辩论。德国社会统计学派权威梅尔( Georg Von Mayr) 国际统计学会秘书长、意大利最高统计会议主席博迪欧( Luigi bodio)和瑞典的米利叶
Gilbert)在卢桑姆斯坦特德农业实验站设置样本区,来试验过磷酸盐与氮肥等各种化学肥料 对收获量的影响。直到 1879 年,他们根据五块地段(33 英亩)的小麦产量来估计全部英格兰 与威尔士从 1852 年至 1879 年每亩产量的变化。1866 年,俄国的拉扎列夫斯基通过样本调查, 对典型农户的家庭收入作了详细观察。 在抽样调查的实践方面,美国的赖特(Ccrrdl Davidson Wright)的贡献是值得一提的。 他主要领导举办了这样几次调查:①1873 年,根据贫民生活改善协会 400 个志愿调查员的报 告,估计了纽约市的失业人数;②1873~1879 年经济危机时期,他借助于马萨诸塞州 19 个 城市的警察署和与375个城镇的财产评估人员的通信,查询失业人数,他估计失业者为28,508 人,纠正了当时对失业人数过高的估计。③20 世纪初,马萨诸塞州一年一次的工商业抽样调 查,以及此后举办的两年一次的全国工商业抽样调查也是在赖特领导下举办的。赖特从事抽 样调查的实际经验,后来给凯尔倡导的代表性调查给予了有力的支持。 在抽样调查发展史上,挪威的凯尔(Anders Niscolai Kiaer)是一个划时代的人物。他对 抽样调查的贡献,无论是在实践还是在理论方面,就当时的条件而言,都是十分卓越的。因 此,马来西亚统计学家尤葆生(You Poh Seng)在《抽样理论与实践发展的历史的考察》一文 中评价到:“凯尔的工作,可以视为统计学史上的一个转折点。他是离开人口普查而用抽样方 法搜集社会资料的第一人,并为抽样理论奠定了基础。”凯乐所组织的抽样调查实践中,比较 有影响的有:①1891 年的挪威国民收入与财富的代表性调查。在这次调查中,可能代表全国 国民收入和财富情况的许多城市、乡区和村落被选出来。在这些区域内按某个年龄、各种社 会阶层、各种婚姻情况以及某种字母起首姓名等标识,把居民的有关情况详细记录下来,从 这些记录来推断出挪威全国国民收入和财富。②1894 年,他主持在挪威全国范围进行关于劳 工退休年金和疾病保险制度的抽样调查,是抽样调查史上一次成功的先例。这次调查根据 1891 年的人口普查资料确定比例,在城乡分别采用不同的抽取方法抽查了 2 万人和 6 万人进 行调查,并且特别强调了所抽选人口的分布状况以增强其代表性。③1895 年,为弄清挪威成 年男子的收入按不同的职业、年龄和社会地位的分布情况,凯尔和汉森(E.Hanssen)等组织了 抽样调查。 以上列举的事实表明,在 1895 年以前,抽样调查的实践应用已经在许多领域展开,这些 都为抽样调查的进一步发展创造了条件,积累了宝贵经验。但这时的抽样调查仍处于探索过 程之中,没有形成系统的理论,也没有得到普遍的认可。因此,德国统计学家詹森(A.Jenson) 认为:“到十九世纪最后十年的中期为止,也就是到 1895 年为止,抽样调查在实际中几乎并 未实行过。”理由是象尤葆生所指出的:“那时负责使用这种方法的统计学家们,既不说明他 们如何抽取样本,也不提所遭遇的困难,以及克服这些困难应采取的途径,由于这些事实, 我们就无法决定是否可以把它们恰当地称为抽样调查。” 2、1895~1925 年。抽样调查逐步得以确认的过程。 凯尔在坚持抽样调查实践的同时,还十分注意对抽样调查的方法和理论进行研究。总结 实践经验,他认为,一次成功的抽样调查应具备两个条件,即正确的代表性和单位的合理选 择。因为“调查结果的准确性,不取决于观察数量的多寡,而取决于取得正确代表性的方法。” 1895 年,国际统计学会(ISI)在瑞士首都伯尔尼召开第五次大会。会上,凯尔提出关 于代表性调查的报告——《对代表性调查的研究和经验》,试图阐明代表性调查的意义,在于 搜集非普查所能提供的详细资料。但同时他也十分小心地强调指出,他并无把这种调查作为 普查或任何通常的调查之意,更无认为这种调查可以取代普查之意,他只是想用“代表性调 查”来表示某种特殊类型的调查而已。他将代表性调查定义为“根据抽样设计,从总体的正 常‘代表’中合理地收集数据”,他强调所调查的样本应是总体的一个“代表”。在这次大会 上,围绕着凯尔的报告,出现了激烈的辩论。德国社会统计学派权威梅尔(Georg Von Mayr), 国际统计学会秘书长、意大利最高统计会议主席博迪欧(Luigi Bodio)和瑞典的米利叶