第十章双样本假设检验及区间估计 我们在掌握了单样本检验与估计的有关方法与原理之后,把视野投向双样本 检验与估计是很自然的。双样本统计,除了有大样本、小样本之分外,根据抽样 之不同,还可分为独立样本与配对样本 独立样本,指双样本是在两个总体中相互独立地抽取的 配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产 生的。配对样本相互之间不独立。 第一节两总体大样本假设检验 为了把单样本检验推广到能够比较两个样本的均值的检验,必须再一次运用 中心极限定理。下面是一条由中心极限定理推广而来的重要定理:如果从 )和[N(∠ 两个总体中分别抽取容量为n1和n2 的独立随机样本,那么两个样本的均值差x1-X2)的抽样分布就 是 N(1-2 2、。与单样本的情况相同,在大样本的 情况下(两个样本的容量都超过50),这个定理可以推广应用于任何具有均值 u1和u2以及方差2和 的两个总体。当n1和n2逐渐变 大时,(X1-x2)的抽样分布像前面那样将接近正态分布。 1.大样本均值差检验 (1)零假设:H:μr-u2=D (2)备择假设: 单侧H1:μμ2>D0 双侧H1:μμ2≠Do 或H1:μrμ2<D (3)否定域:单侧Z 双侧Za/2 (4)检验统计量 (5)比较判定
第十章 双样本假设检验及区间估计 我们在掌握了单样本检验与估计的有关方法与原理之后,把视野投向双样本 检验与估计是很自然的。双样本统计,除了有大样本、小样本之分外,根据抽样 之不同,还可分为独立样本与配对样本。 独立样本, 指双样本是在两个总体中相互独立地抽取的 。 配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产 生的。配对样本相互之间不独立。 第一节 两总体大样本假设检验 为了把单样本检验推广到能够比较两个样本的均值的检验,必须再一次运用 中心极限定理。下面是一条由中心极限定理推广而来的重要定理:如果从 和 两个总体中分别抽取容量为 n1 和 n2 的独立随机样本,那么两个样本的均值差 的抽样分布就 是 。与单样本的情况相同,在大样本的 情况下(两个样本的容量都超过 50),这个定理可以推广应用于任何具有均值 μ1 和μ2 以及方差 和 的两个总体。当 n1 和 n2 逐渐变 大时, 的抽样分布像前面那样将接近正态分布。 1.大样本均值差检验 (1)零假设:H0:μ1-μ2=D0 (2)备择假设: 单侧 H1:μ1-μ2>D0 双侧 H1:μ1-μ2 ≠ D0 或 H1:μ1-μ2< D0 (3)否定域:单侧 Zα 双侧 Zα/2 (4)检验统计量 (5)比较判定 ( , ) 2 N 1 1 ( , ) 2 N 2 2 (X1 − X2 ) ( , ) 2 2 2 1 2 1 1 2 n n N − + 2 1 2 2 (X1 − X2 ) 2 2 2 1 2 1 1 2 0 n n X X D Z + − − =
[例]为了比较已婚妇女对婚后生活的态度是否因婚龄而有所差别,将已婚妇 女按对婚后生活的态度分为“满意”和“不满意”两组。从满意组中随机抽取 600名妇女,其平均婚龄为8.5年,标准差为2.3年;从不满意组抽出500名妇 女,其平均婚龄为9.2年,标准差2.8年。试问在0.05显著性水平上两组是否 存在显著性差异? 样本 人数均值标准差 满意组 8.5 2.3 不满意组 500 9.2 2.8 [解]据题意, “不满意”组的抽样结果为:区}=9.2年,S1=2.8年,n1=500 满意”组的抽样结果为 8.5年,S2=2.3年,n2=600。 HO:p1-u2=D0=0 Hl:μ1-12≠0 计算检验统计量 2-8.5 50O 600 确定否定域, 因为a=0.05,因而有Za/2=1.96<4.47 因此否定零假设,即可以认为在0.05显著性水平上,婚龄对妇女婚后 生活的态度是有影响的。同时我们看到,由于样本计算值Z=4.47远大于单侧 Z0.05的临界值1.65,因此本题接受μ1-u2>0的备择假设,即可以认为 妇女婚龄长容易对婚后生活产生“不满意”。 2.大样本成数差检验 (1)零假设 (2)备择假设 单侧H:μμ2>D 双侧H:μ-μ2≠Db 或H1:μ1μ2<D
[例]为了比较已婚妇女对婚后生活的态度是否因婚龄而有所差别,将已婚妇 女按对婚后生活的态度分为“满意”和“不满意”两组。从满意组中随机抽取 600 名妇女,其平均婚龄为 8.5 年,标准差为 2.3 年;从不满意组抽出 500 名妇 女,其平均婚龄为 9.2 年,标准差 2.8 年。试问在 0.05 显著性水平上两组是否 存在显著性差异? 样本 人数 均值 标准差 满意组 600 8.5 2.3 不满意组 500 9.2 2.8 [解] 据题意, “不满意”组的抽样结果为: =9.2 年, S1=2.8 年, n1=500; “满意”组的抽样结果为: =8.5 年,S2=2.3 年, n2=600。 H0:μ1―μ2=D0=0 H1: μ1―μ2 ≠0 计算检验统计量 确定否定域, 因为α=0.05,因而有 Zα/2=1.96<4.47 因此否定零假设,即可以认为在 0.05 显著性水平上,婚龄对妇女婚后 生活的态度是有影响的。同时我们看到,由于样本计算值 Z=4.47 远大于单侧 Z0.05 的临界值 1. 65,因此本题接受μ1―μ2 >0 的备择假设,即可以认为 妇女婚龄长容易对婚后生活产生“不满意”。 2.大样本成数差检验 (1)零假设: (2)备择假设: 单侧 H1:μ1-μ2>D0 双侧 H1:μ1-μ2 ≠ D0 或 H1:μ1-μ2< D0 X1 X2 4.47 600 2.3 500 2.8 9.2 8.5 2 2 2 2 2 1 2 1 1 2 0 = + − = + − − = n n X X D Z 0 1 2 0 H : p − p = D
(3)否定域:单侧Z 双侧Za/2 (4)检验统计量 (P1 )-D (P1-P2) P191+ P212 当pl和p2未知,须用样本成数 A 进行估算时,分以下两 种情况讨论: ①若零假设中两总体成数的关系为P=P2,这时两总体可看作成数P 相同的总体,它们的点估计值为 此时上式中检验统计量Z可简化为 p2 PI Puqu Puqi V%,/+2 n,n2 ②若零假设中两总体成数P1≠P2,那么它们的点估计值有 P1 此时上式中检验统计量Z为 (5)判定
(3)否定域:单侧 Zα 双侧 Zα/2 (4)检验统计量 当 p1 和 p2 未知,须用样本成数 和 进行估算时,分以下两 种情况讨论: ① 若零假设中两总体成数的关系为 P1=P2 ,这时两总体可看作成数 P 相同的总体,它们的点估计值为 此时上式中检验统计量 Z 可简化为 ② 若 零 假 设 中 两 总 体 成 数 P1 ≠ P2 , 那 么 它 们 的 点 估 计 值 有 此时上式中 检验统计量 Z 为 (5)判定 2 2 2 1 1 1 1 2 ( ) 1 2 0 1 2 0 ( ) ( ) n p q n p q p p D p p D Z p p + − − = − − = − p1 p2 1 2 1 1 2 2 1 2 1 2 n n n p n p n n X X p + + = + + = 1 2 1 2 1 2 1 2 ( 1 2 ) 0 n n n n p q p p n p q n p q p p Z + − = + − − = p1 p1 p2 p2 2 2 2 1 1 1 ( 1 2 ) 0 n p q n p q p p D Z + − − =
[例]有一个大学生的随机样本,按照性格“外向”和“内向”,把他们分成 两类。结果发现,新生中有73%属于“外向”类,四年级学生中有58%属于“外 向”类。样本中新生有171名,四年级学生有117名。试问,在0.01水平上, 两类学生有无显著性差异? 第二节两总体小样本假设检验 与对单总体小样本假设检验一样,我们对两总体小样本假设检只讨论总体满 足正态分布的情况。 1.小样本均值差假设检验 (1)当和2已知时,小样本均值差检验,与上一节所述 大样本总体均值差检验完全相同,这里不再赘述 未知,但假定它们相等时,关键是要解决 的算式。 现又因为σ未知,所以要用它的无偏估计量 替代它。由于两个样本的方 差基于不同的样本容量,因而可以用加权的方法求出σ的无偏估计量,得 n1S12+n2S2 Vn1+n2-2 注意,上式的分母上减2,是因为根据国和国计算S1和S2 时,分别损失了一个自由度,一共损失了两个自由度,所以全部自由度的数目就 成为(n1+n2-2)。于是有 n
[例]有一个大学生的随机样本,按照性格“外向”和“内向”,把他们分成 两类。结果发现,新生中有 73%属于“外向”类,四年级学生中有 58%属于“外 向”类。样本中新生有 171 名,四年级学生有 117 名。试问,在 0.01 水平上, 两类学生有无显著性差异? 第二节 两总体小样本假设检验 与对单总体小样本假设检验一样,我们对两总体小样本假设检只讨论总体满 足正态分布的情况。 1. 小样本均值差假设检验 (1) 当 和 已知时,小样本均值差检验,与上一节所述 大样本总体均值差检验完全相同,这里不再赘述。 (2) 和 未知,但假定它们相等时, 关键是要解决 的算式。 现又因为σ未知,所以要用它的无偏估计量 替代它。由于两个样本的方 差基于不同的样本容量,因而可以用加权的方法求出σ的无偏估计量,得 注意,上式的分母上减 2,是因为根据 和 计算 S1 和 S2 时,分别损失了一个自由度,一共损失了两个自由度,所以全部自由度的数目就 成为(n1+ n2―2)。 于是有 2 1 2 2 2 1 2 2 ( X1−X2 ) S X1 X2 1 2 2 2 2 2 2 1 1 + − + = n n n S n S S ( X1−X2 ) 1 2 1 2 n n n n S + =
[例]为研究某地民族间家庭规模是否有所不同,各做如下独立随机抽样: 民族A:12户,平均人口6.8人,标准差1.5人 民族B:12户,平均人口5.3人,标准差0.9人 问:能否认为A民族的家庭平均人口高于B民族的家庭平均人口(a =0.05)?(假定家庭平均人口服从正态分布,且方差相等)t=2.97 [例]某市对儿童体重情况进行调查,抽查8岁的女孩20人,平均体重 22.2千克,标准差2.46千克:抽查8岁的男孩18人,平均体重21.3千克,标 准差1.82千克。若男女儿童体重的总体方差相等,问在显著性水平5%上,该年 龄男女儿童之体重有无显著差异? 2.小样本方差比检验 在实际研究中,除了要比较两总体的均值外,有时还需要比较两总体的方差。 例如对农村家庭和城镇家庭进行比较,除了平均收入的比较外,还要用方差比较 收入的不平均情况。此外,刚刚在小样本均值差的检验中曾谈到,当方差未知时, 往往还假设两总体方差相等。因此,在总体方差未知的情况下,先进行方差比检 验,对于均值差检检验也是具有一定意义的。 设两总体分别满足正态分N(A和N(∠22·现从这 两个总体中分别独立地各抽取一个随机样本,并具有容量n1,n2和方差 根据第八章(8.22)式,对两总体样本方差的抽样分布分别有 x2(n1-1) x2(n2-1)
[例]为研究某地民族间家庭规模是否有所不同,各做如下独立随机抽样: 民族 A:12 户,平均人口 6.8 人,标准差 1.5 人 民族 B:12 户,平均人口 5.3 人,标准差 0.9 人 问:能否认为 A 民族的家庭平均人口高于 B 民族的家庭平均人口( α =0.05)?(假定家庭平均人口服从正态分布,且方差相等)t=2.97 [例] 某市对儿童体重情况进行调查,抽查 8 岁的女孩 20 人,平均体重 22.2 千克,标准差 2.46 千克;抽查 8 岁的男孩 18 人,平均体重 21.3 千克,标 准差 1.82 千克。若男女儿童体重的总体方差相等,问在显著性水平 5%上,该年 龄男女儿童之体重有无显著差异? 2.小样本方差比检验 在实际研究中,除了要比较两总体的均值外,有时还需要比较两总体的方差。 例如对农村家庭和城镇家庭进行比较,除了平均收入的比较外,还要用方差比较 收入的不平均情况。此外,刚刚在小样本均值差的检验中曾谈到,当方差未知时, 往往还假设两总体方差相等。因此,在总体方差未知的情况下,先进行方差比检 验,对于均值差检检验也是具有一定意义的。 设两总体分别满足正态分布 和 。现从这 两个总体中分别独立地各抽取一个随机样本,并具有容量 n1,n2 和方差 S1 2 , S2 2 。根据第八章(8.22)式,对两总体样本方差的抽样分布分别有 ( , ) 2 N 2 2 ( , ) 2 N 2 2 ~ ( 1) 1 2 2 1 2 1 1 n − n S ~ ( 1) 2 2 2 2 2 2 2 n − n S