因此,在假设测验中如何既减少α错误,又减少错误,是特别需要注意的问题。 这可从两个方面考虑: (1)如果和0相差对于G2来说是大的,则显著水平可以提高,而犯B错误的 概率又可大大减少。如上述例,若新品种的4=525kg,则即使取α=0.01,犯β错 误的概率也只有0.0559(图54);如果仍取α=0.05,则犯β错误的概率就只有0.0136。 (2)由于和A相差不是主观能改变的客观存在,因此在试验实践中,减少σx 是减少两类错误的关键。由于样本平均数标准误r ,因而通过精密的试验 设计和改进试验技术以及增大样本容量可使σx减小,于是接受区域可变得十分狭窄, 和u0的较小差异也易于被发现。如上述例,假定新品种的x是n=150的平均数, 324 407/1502.16,ax=147,因而在a=005时的接受区域为500±196×147 则 0288,在此情况下,若H=505kg,则我们不能发现Hl:p=0为 错误的概率β只有00749(图5.5)。如n继续增大,则犯两类错误的概率均可继续 小 综上所述,有关两类错误的讨论可概括如下: 本节是以依据于u分布的一个平均数为例,说明统计假设测验的基本原理。这些 原理对于其他统计数的假设测验以及依据于t、z2、F分布的假设测验,也同样适用。 第二节平均数的假设测验 、单个样本平均数的假设测验 这是测验一个样本平均数x的总体平均数山与某一指定的总体平均数u0是否相 1、u测验 在第4章已述及,在正态总体Mμ,a2)中抽样(无论样本容量n多大)或在非 正态总体中以n>30抽样时,均可用u测验Ho(σ2未知时,用s2代替)。其方法 已详细介绍于例5.1。 2、t测验 若正态总体的a2未知,而样本容量又不太大(n<30),如以样本的s2估计a2 则标准化离差x一服从自由度y=n-1的t分布。 [例5.2]某当地推广玉米品种百粒重μo=32(g 现有一新品种百粒重 x=3367(g)(在十个小区种)
6 因此,在假设测验中如何既减少错误,又减少β错误,是特别需要注意的问题。 这可从两个方面考虑: (1)如果和 0 相差对于 2 x 来说是大的,则显著水平可以提高,而犯β错误的 概率又可大大减少。如上述例,若新品种的 =525 kg,则即使取 =0.01,犯β错 误的概率也只有 0.0559(图 5.4);如果仍取=0.05,则犯 错误的概率就只有 0.0136。 (2)由于和0 相差不是主观能改变的客观存在,因此在试验实践中,减少 x 是减少两类错误的关键。由于样本平均数标准误 x = n ,因而通过精密的试验 设计和改进试验技术以及增大样本容量可使 x 减小,于是接受区域可变得十分狭窄, 和 0 的较小差异也易于被发现。如上述例,假定新品种的 x 是 n = 150 的平均数, 则 2 x = 150 324 = 2.16, x = 1.47,因而在 =0.05 时的接受区域为 500 ±1.96 ×1.47 = 497.12 - 502.88,在此情况下,若 = 505 kg,则我们不能发现 H0: = 0 为 错误的概率β只有 0.0749(图 5.5)。如 n 继续增大,则犯两类错误的概率均可继续 减小。 综上所述,有关两类错误的讨论可概括如下: 本节是以依据于 u 分布的一个平均数为例,说明统计假设测验的基本原理。这些 原理对于其他统计数的假设测验以及依据于 t、 2 、F 分布的假设测验,也同样适用。 第二节 平均数的假设测验 一、单个样本平均数的假设测验 这是测验一个样本平均数 x 的总体平均数与某一指定的总体平均数 0 是否相 等。 1、u 测验 在第 4 章已述及,在正态总体 N( , 2)中抽样(无论样本容量 n 多大)或在非 正态总体中以 n > 30 抽样时,均可用 u 测验 H0( 2 未知时,用 s 2 代替)。其方法 已详细介绍于例 5.1。 2、t 测验 若正态总体的 2 未知,而样本容量又不太大(n < 30),如以样本的 s 2 估计 2, 则标准化离差 s n x / − 服从自由度 = n - 1 的 t 分布。 [例 5.2]某当地推广玉米品种百粒重 0=32(g 现有一新品种百粒重 x =33.67(g) ( 在十个小区种)
问:新品种的百粒重与原当地品种百粒重有无显著差异? (1)H0:=0=32g(即:新品种百粒重与当地品种百粒重相同)对HA:μ (2)显著水平a=005 (3)测验计算 336.7 1+32.9+…+33.6)= =3367(g) SS=3312+3292+…+3362-33672 =26.761 V10-1 1.7244 0.5453 33.67-32 0.5453 (4)查附表5,V=9时,105=2.262。现实得|t|>t0s,故P<0.05。 推断,否定H0:=0=32g,即新品种百粒重与当地品种百粒重有显著差异 两个样本平均数相比较的假设测验 这是测验两个样本所属的总体平均数有无显著差异 1、成组数据的平均数比较 如果两个处理为完全随机设计,而处理间(组间)的试验单元彼此独立,则不论 两处理的样本容量是否相同,所得数据皆称为成组数据。成组数据的平均数比较又依 两个样本所属总体方差(σ12和2)是否已知、是否相等而采用不同的测验方法 现分述如下 (1)u测验 在两个样本所属的总体方差2和2为已知时,用u测验 根据抽样分布的公式知两个样本平均数x1和x2的差数标准误,在G2和 a2已知时为 心×、么
7 问:新品种的百粒重与原当地品种百粒重有无显著差异? (1)H0:= 0=32g (即:新品种百粒重与当地品种百粒重相同) 对 HA: ≠ 32g。 (2)显著水平 =0.05 (3)测验计算 x = 10 1 (33.1 + 32.9 + … +33.6) = 10 336.7 = 33.67(g) SS = 33.12 + 32.92 + … +33.6 2 - 2 10 336.7 = 26.761 s = 10 1 26.761 − =1.7244 s x = 10 1.7244 = 0.5453 t = 0.5453 33.67 − 32 = 3.063 (4)查附表 5, =9 时,t0.05 = 2.262。现实得 |t| > t0.05,故 P < 0.05。 推断,否定 H0:= 0=32g,即新品种百粒重与当地品种百粒重有显著差异。 二、两个样本平均数相比较的假设测验 这是测验两个样本所属的总体平均数有无显著差异。 1、成组数据的平均数比较 如果两个处理为完全随机设计,而处理间(组间)的试验单元彼此独立,则不论 两处理的样本容量是否相同,所得数据皆称为成组数据。成组数据的平均数比较又依 两个样本所属总体方差( 2 1 和 2 2 )是否已知、是否相等而采用不同的测验方法, 现分述如下。 (1)u 测验 在两个样本所属的总体方差 2 1 和 2 2 为已知时,用 u 测验。 根据抽样分布的公式知,两个样本平均数 x 1 和 x 2 的差数标准误 1 2 x −x ,在 2 1 和 2 2 已知时为: 1 2 x −x = 2 2 2 1 2 1 n n + 并有:
0 在假设H:仙==0下,正态离差u值为a=(x1-x2) ,故可对两个平均数 差数的差异作出假设测验 [例5.3]A法x=1.2(kg)m=12a2=04(kg)2 B法x2=14(kg)m=8 比较A、B两法每平方米产量是否有显著差异? H4:1=42(或H:-42=0);对HA:山≠2, 显著水平a=0.05,1005=1.96 测验计算: 1=2=0.4,m=12,m=8 404 =0.2887(kg) 1.2-1.4 0.2887 因为实得的||<105=196,故P>0.05,推断:接受H:A=2,即A、B两 法取样方法所得每平方米产量没有显著差异 (2)t测验 在两个总体方差σ2和2为未知时,用t测验。因总体方差G2和G2是否相等 分为以下两种测验方法 ①在两个总体方差a1和2为未知,但可假定σ=02=2,用t测验。 首先,应将样本变异合并成一个平均的均方S2,作为对G2的估计,即有: x1)2+X(x2-2)2M2-(Xx1)2 V1+ (n1-1)+(m2-1) (n1-1)+(m2-1) n n2 若 n1-/2-n s (5.3) 并有:
8 u = 1 2 ( ) ( ) 1 2 1 2 x x x x − − − − 在假设 H0:1 = 2=0 下,正态离差 u 值为 u = 1 2 ( ) 1 2 x x x x − − ,故可对两个平均数 差数的差异作出假设测验。 [例 5.3] A 法 1 x =1.2(kg) n1 = 12 2 = 0.4(kg)2 B 法 2 x =1.4(kg) n2 =8 比较 A、B 两法每平方米产量是否有显著差异? H0:1 = 2(或 H0:1 − 2=0);对 HA:1 ≠ 2, 显著水平 =0.05,u 0.05 = 1.96。 测验计算: 2 2 2 1 2 = = = 0.4,n1 = 12,n2 = 8, 1 2 x −x = 8 0.4 12 0.4 + = 0.2887(kg) 0.2887 1.2 −1.4 u = = -0.69 因为实得的|u|< u0.05 = 1.96,故 P > 0.05,推断:接受 H0:1 = 2,即 A、B 两 法取样方法所得每平方米产量没有显著差异。 (2)t 测验 在两个总体方差 2 1 和 2 2 为未知时,用 t 测验。因总体方差 2 1 和 2 2 是否相等 分为以下两种测验方法。 ① 在两个总体方差 2 1 和 2 2 为未知,但可假定 2 1 = 2 2 = 2 ,用 t 测验。 首先,应将样本变异合并成一个平均的均方 2 e s ,作为对 2 的估计,即有: 2 e s = 1 2 1 2 + SS + SS = ( 1) ( 1) ( ) ( ) 1 2 2 2 2 2 1 1 − + − − + − n n x x x x = ( 1) ( 1) ( ) / ( ) / 1 2 2 2 2 2 1 2 2 1 2 1 − + − − + − n n x x n x x n 1 2 x x s − = 2 2 1 2 n s n se e + = ) 1 1 ( 1 2 2 n n se + (5.2) 若 n1=n2=n 时,则: 1 2 x x s − = n se 2 2 (5.3) 并有: