第三节推断市场总体 抽样调查的目的,是用样本指标推断总体指标。通常较多用的是用样本平均数推断总体 平均数,用样本成数推断总体成数等。当谈到随机抽样时,仅仅了解随机抽样抽取样本的方 法是不够的,还必须要知道抽取了样本,计算了样本指标后,如何用样本指标推断总体。对 于这个问题,应该分两步考虑:首先是看样本指标和总体指标之间的差异能否用具体数量表 示;其次是如何利用样本指标及其与总体指标之间的差异来推断总体指标 、抽样误差 1、定义: 抽样误差,是指随机抽样调查中样本指标与总体指标之间的差异 抽样误差的大小,由于抽样方法的不同而有所差别。一般来说,重复抽样的误差大于不 重复抽样的误差;也各不相同。从理论上对抽样误差进行介绍时,一般以单纯随机抽样法为 基础,用重复抽样误差公式为例,计算抽样平均误差。 2、在重复抽样条件下, (1)简单随机抽样抽样平均数的抽样平均误差计算公式是: /n 式中;41抽样平均数的抽样误差 σ总体的标准差 n样本单位数 (2)抽样成数抽样平均误差计算公式是 P(-P) 式中:μ,抽样成数抽样平均误差 p总体成数 n样本单位数 需要说明的是,在抽样误差计算公式中,要求用总体标准差和总体成数,但在此问题中 只具有样本标准差和样本成数。抽样调査的理论证明,在大样本情况(n≥30)下,可以采用 样本标准差代替总体标准差,用样本成数代替总体成数 例如:假定在某城市某街道办事处所管辖的10000户居民中,用单纯随机抽样方法抽取 200户,对某种商品的月平均需求量和需求倾向进行调查。对200户居民采用问卷法搜集资料, 对资料整理、分析计算的结果表明,每户居民对该商品的月平均需求量为500克,标准差为 100克;表示一年内不选择其他替代商品,继续消费该商品的居民户为90%。现对抽样平均 数和抽样成数的抽样误差进行计算。 抽样平均数的抽样误差为 =7.1(克) 200 抽样成数的抽样误差为: P(1-P)0.9×(1-09) P 200 上面所计算出的抽样误差,用数字说明由于随机原因样本指标与总体指标之间的差异。 总体的标准差越大,即总体各单位之间客观存在的差异越大抽样误差也就越大。抽样的 6
6 第三节 推断市场总体 抽样调查的目的,是用样本指标推断总体指标。通常较多用的是用样本平均数推断总体 平均数,用样本成数推断总体成数等。当谈到随机抽样时,仅仅了解随机抽样抽取样本的方 法是不够的,还必须要知道抽取了样本,计算了样本指标后,如何用样本指标推断总体。对 于这个问题,应该分两步考虑:首先是看样本指标和总体指标之间的差异能否用具体数量表 示;其次是如何利用样本指标及其与总体指标之间的差异来推断总体指标。 一、抽样误差 1、 定义: 抽样误差,是指随机抽样调查中样本指标与总体指标之间的差异。 抽样误差的大小,由于抽样方法的不同而有所差别。一般来说,重复抽样的误差大于不 重复抽样的误差;也各不相同。从理论上对抽样误差进行介绍时,一般以单纯随机抽样法为 基础,用重复抽样误差公式为例,计算抽样平均误差。 2、在重复抽样条件下, (1)简单随机抽样抽样平均数的抽样平均误差计算公式是: x = n 式中: x 抽样平均数的抽样误差 总体的标准差 n 样本单位数 (2)抽样成数抽样平均误差计算公式是: n P P p (1− ) = 式中: μp 抽样成数抽样平均误差 p 总体成数 n 样本单位数 需要说明的是,在抽样误差计算公式中,要求用总体标准差和总体成数,但在此问题中 只具有样本标准差和样本成数。抽样调查的理论证明,在大样本情况(n≥30)下,可以采用 样本标准差代替总体标准差,用样本成数代替总体成数。 ‘ 例如:假定在某城市某街道办事处所管辖的10 000户居民中,用单纯随机抽样方法抽取 200户,对某种商品的月平均需求量和需求倾向进行调查。对200户居民采用问卷法搜集资料, 对资料整理、分析计算的结果表明,每户居民对该商品的月平均需求量为500克,标准差为 100克;表示一年内不选择其他替代商品,继续消费该商品的居民户为90%。现对抽样平均 数和抽样成数的抽样误差进行计算。 抽样平均数的抽样误差为: x = n = 200 100 =7.1(克) 抽样成数的抽样误差为: n P P p (1− ) = = 200 0.9(1− 0.9) =0.02 上面所计算出的抽样误差,用数字说明由于随机原因样本指标与总体指标之间的差异。 总体的标准差越大,即总体各单位之间客观存在的差异越大抽样误差也就越大。抽样的
单位越大抽样误差就越小。 因此在实践中,为了有效地控制样本指标与总体指标之间的误差,更准确地推断总体指 标,往往可以通过加大样本单位数(样本容量)的办法,或对总体分层抽样的办法,减小或控 制抽样误差。 利用样本指标和所计算出的抽样误差,可以对相应的市场总体指标进行区间估计。 推断总体 在市场抽样调查中推断总体,应用的是统计推断原理。 统计推断即用样本指标推断总体指标的过程。 统计推断一般是采用区间估计的方法。区间估计就是在一定的抽样误差范围内建立一个 置信区间,并联系这个区间的置信度以样本指标推断总体指标o 1.抽样估计的置信度 (1)定义 所谓置信度就是进行推断时的可靠程度大小。 抽样推断可靠程度,是指总体所有可能样本的指标落在一定区间的概率度。 抽样推断可靠程度有高低之分,通常用%表示。 对于置信度与抽样误差之间的关系,数理统计的理论可用正态分布来描述它,即在抽样 误差前乘以t,并使置信度成为t的分布函数F(t),将二者关系对应起来建立正态分布概率表 以便使用时查找。这样任何一个置信度都可以查到对应的t值。如前面所说的几个常用的置 信度90%,95%,99%,所对应的t值分别是:1.65,1:96,2.58。任何一个t倍抽样误 差范围也可以查到对应的置信度。t=1时置信度为68.27%,t=2时置信度为95.45%,t=3 时置信度为99.73% 在市场调査实践中,对于抽样误差范围或置信度,是在调查方案中事先规定的,并据此 确定样本单位数。书后附表2即为正态分布概率表 (2)抽样误差与置信度的关系 抽样误差与置信度是一对矛盾。如果加大t值,当然可以提高置信度:但随着置信度的 提高必然加大抽样误差范围,就降低了抽样调查的准确程度。因此,在市场抽样调査的实践 中,既不能只强调置信度而忽视了市场调査的准确度,也不能只重视准确度而不顾调查总体 数据的置信度。对调査的准确度和置信度,应根据市场调查的具体需要和市场现象的不同特 点,综合地考虑二者的关系 2.市场随机抽样的区间估计 区间估计是统计推断的常用方法,它是在考虑到抽样误差的情况下以样本指标推断总体 指标的过程,同时必须联系到前面所谈到的抽样误差与置信度的关系。 区间估计可以用样本平均数推断总体平均数,也可以用样本成数推断总体成数 用样本平均数推断总体平均数的区间估计公式为 x-1≤X≤x+1(x 式中:F总体平均数: x样本平均数; 142抽样平均数误差范围 以上区间估计公式说明,总体平均数表现为样本平均数加减抽样误差范围的区间 值,而不是一个固定点值。 用样本成数推断总体成数的区间估计公式为: P-n≤Psp+1p 式中:P总体成数
7 单位越大抽样误差就越小。 因此在实践中,为了有效地控制样本指标与总体指标之间的误差,更准确地推断总体指 标,往往可以通过加大样本单位数(样本容量)的办法,或对总体分层抽样的办法,减小或控 制抽样误差。 利用样本指标和所计算出的抽样误差,可以对相应的市场总体指标进行区间估计。 二、推断总体 : 在市场抽样调查中推断总体,应用的是统计推断原理。 统计推断即用样本指标推断总体指标的过程。 统计推断一般是采用区间估计的方法。区间估计就是在一定的抽样误差范围内建立一个 置信区间,并联系这个区间的置信度以样本指标推断总体指标o 1.抽样估计的置信度 (1)定义 所谓置信度就是进行推断时的可靠程度大小。 抽样推断可靠程度,是指总体所有可能样本的指标落在一定区间的概率度。 抽样推断可靠程度有高低之分,通常用%表示。 对于置信度与抽样误差之间的关系,数理统计的理论可用正态分布来描述它,即在抽样 误差前乘以t,并使置信度成为t的分布函数F(t),将二者关系对应起来建立正态分布概率表, 以便使用时查找。这样任何一个置信度都可以查到对应的t值。如前面所说的几个常用的置 信度90%,95%,99%,所对应的t值分别是:1.65,l:96,2.58。任何一个t倍抽样误 差范围也可以查到对应的置信度。t=1时置信度为68.27%,t=2时置信度为95.45%,t=3 时置信度为99.73%。 在市场调查实践中,对于抽样误差范围或置信度,是在调查方案中事先规定的,并据此 确定样本单位数。书后附表2即为正态分布概率表。 (2)抽样误差与置信度的关系 抽样误差与置信度是一对矛盾。如果加大t值,当然可以提高置信度;但随着置信度的 提高必然加大抽样误差范围,就降低了抽样调查的准确程度。因此,在市场抽样调查的实践 中,既不能只强调置信度而忽视了市场调查的准确度,也不能只重视准确度而不顾调查总体 数据的置信度。对调查的准确度和置信度,应根据市场调查的具体需要和市场现象的不同特 点,综合地考虑二者的关系o 2.市场随机抽样的区间估计 区间估计是统计推断的常用方法,它是在考虑到抽样误差的情况下以样本指标推断总体 指标的过程,同时必须联系到前面所谈到的抽样误差与置信度的关系。 区间估计可以用样本平均数推断总体平均数,也可以用样本成数推断总体成数。 用样本平均数推断总体平均数的区间估计公式为: x x x − t X x + t 式中: X 总体平均数; x 样本平均数; x t 抽样平均数误差范围。 以上区间估计公式说明,总体平均数表现为样本平均数加减抽样误差范围的区间 值,而不是一个固定点值。 用样本成数推断总体成数的区间估计公式为: p p p − t P p + t 式中:P 总体成数;