第七章假设检验 本章主要讲述假设检验思想概述;正态总体参数检验(u检验,t检验,x 内容检验和F检验):非正态总体参数检验(非正态总体均值检验的大样本方法,指 数总体的参数检验);检验的实际意义及两类错误(检验结果的实际意义,检验 提要中的两类错误,样本容量确定问题)等内容 1、理解假设检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能产生 的两类错误 重点2、了解单个和两个正态总体的均值与方差的假设检验。 分析3、了解总体分布假设的x2检验法。 难点 假设检验的基本思想、基本步骤及假设检验可能产生的两类错误。 分析 习题 布置习题7(1,5,70.13.16,18 备注
第七章 假设检验 内容 提要 本章主要讲述假设检验思想概述;正态总体参数检验( u 检验, t 检验, 2 检验和 F 检验);非正态总体参数检验(非正态总体均值检验的大样本方法,指 数总体的参数检验);检验的实际意义及两类错误(检验结果的实际意义,检验 中的两类错误,样本容量确定问题)等内容. 重点 分析 1、理解假设检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能产生 的两类错误。 2、了解单个和两个正态总体的均值与方差的假设检验。 3、了解总体分布假设的 2 检验法。 难点 分析 假设检验的基本思想、基本步骤及假设检验可能产生的两类错误。 习题 布置 习题 7 (1,3,5,7,10,13,16,18) 备注
教学内容( Contents Chapter seven假设检验 hypothesis Tests) §71假设检验思想概述( Summary of Hypothesis Test Idea) 前一章讲了对总体参数的估计问题,即是对样本进行适当的加工,以推断出参数的值(或 置信区间)。本章介绍的假设检验,是另一大类统计推断问题。它是先假设总体具有某种特征 (例如总体的参数为多少),然后再通过对样本的加工,即构造统计量,推断出假设的结论是 否合理。从纯粹逻辑上考虑,似乎对参数的估计与对参数的检验不应有实质性的差别,犹如 说:“求某方程的根”与“验证某数是否是某方程的根”这两个问题不会得出矛盾的结论一样, 但从统计的角度看估计和检验,这两种统计推断是不同的,它们不是简单的“计算”和“验 算”的关系。假设检验有它独特的统计思想,也就是说引入假设检验是完全必要的。我们来 考虑下面的例子 Example7.1某厂家向一百货商店长期供应某种货物,双方根据厂家的传统生产水平, 定出质量标准,即若次品率超过3%,则百货商店拒收该批货物。今有一批货物,随机抽43件 检验,发现有次品2件,问应如何处理这批货物? 如果双方商定用点估计方法作为验收方法,显然243>3%,这批货物是要被拒收的。但 是厂家有理由反对用这种方法验收。他们认为,由于抽样是随机的,在这次抽样中,次品的 频率超过3%,不等于说这批产品的次品率p(概率)超过了3%就如同说掷一枚钱币,正 反两面出现的概率各为12,但若掷两次钱币,不见得正、反面正好各出现一次一样。就是说 即使该批货的次品率为3%,仍有很大的概率使得在抽检43件货物时出现2个以上的次品, 因此需要用别的方法。如果百货商店也希望在维护自己利益的前提下,不轻易地失去一个有 信誉的货源,也会同意采用别的更合理的方法。事实上,对于这类问题,通常就是采用假设 检验的方法。具体来说就是先假设次品率P≤3%,然后从抽样的结果来说明P≤3%这一假 设是否合理。注意,这里用的是“合理”一词,而不是“正确”,粗略地说就是“认为p≤3%” 能否说得过去。具体如何做,下面再说 还有一类问题实际上很难用参数估计的方法去解决。 Example7.2某研究所推出一种感冒特效新药,为证明其疗效,选择200名患者为志愿 者。将他们均分为两组,分别不服药或服药,观察三日后痊愈的情况,得出下列数据 是否痊愈 痊愈者未痊愈者合计 服何种药 未服药者 服药者 问新药是否确有明显疗效? 这个问题就不存在估计什么的问题。从数据来看,新药似乎有一定疗效,但效果不明显, 服药者在这次试验中的情况比未服药者好,完全可能是随机因素造成的。对于新药上市这样 关系到千万人健康的事,一定要采取慎重的态度。这就需要用一种统计方法来检验药效,假 设检验就是在这种场合下的常用手段。具体来说,我们先不轻易地相信新药的作用,因此可 以提出假设“新药无效”,除非抽样结果显著地说明这假设不合理,否则,将不能认为新药 有明显的疗效。这种提出假设然后做出否定或不否定的判断通常称为显著性检验( Significance test) 假设检验也可分为参数检验( Parametric test)和非参数检验( Nonparametric test)。当总体 分布形式已知,只对某些参数做出假设,进而做出的检验为参数检验;对其它假设做出的检
84 教 学 内 容 ( Contents ) Chapter Seven 假设检验(Hypothesis Tests) §7.1 假设检验思想概述(Summary of Hypothesis Test Idea) 前一章讲了对总体参数的估计问题,即是对样本进行适当的加工,以推断出参数的值(或 置信区间)。本章介绍的假设检验,是另一大类统计推断问题。它是先假设总体具有某种特征 (例如总体的参数为多少),然后再通过对样本的加工,即构造统计量,推断出假设的结论是 否合理。从纯粹逻辑上考虑,似乎对参数的估计与对参数的检验不应有实质性的差别,犹如 说:“求某方程的根”与“验证某数是否是某方程的根”这两个问题不会得出矛盾的结论一样。 但从统计的角度看估计和检验,这两种统计推断是不同的,它们不是简单的“计算”和“验 算”的关系。假设检验有它独特的统计思想,也就是说引入假设检验是完全必要的。我们来 考虑下面的例子。 Example 7.1 某厂家向一百货商店长期供应某种货物,双方根据厂家的传统生产水平, 定出质量标准,即若次品率超过3%,则百货商店拒收该批货物。今有一批货物,随机抽43件 检验,发现有次品2件,问应如何处理这批货物? 如果双方商定用点估计方法作为验收方法,显然2/43>3%,这批货物是要被拒收的。但 是厂家有理由反对用这种方法验收。他们认为,由于抽样是随机的,在这次抽样中,次品的 频率超过3%,不等于说这批产品的次品率 p (概率)超过了3%.就如同说掷一枚钱币,正 反两面出现的概率各为1/2,但若掷两次钱币,不见得正、反面正好各出现一次一样。就是说, 即使该批货的次品率为3%,仍有很大的概率使得在抽检43件货物时出现2个以上的次品, 因此需要用别的方法。如果百货商店也希望在维护自己利益的前提下,不轻易地失去一个有 信誉的货源,也会同意采用别的更合理的方法。事实上,对于这类问题,通常就是采用假设 检验的方法。具体来说就是先假设次品率 p 3% ,然后从抽样的结果来说明 p 3% 这一假 设是否合理。注意,这里用的是“合理”一词,而不是“正确”,粗略地说就是“认为 p 3% ” 能否说得过去。具体如何做,下面再说。 还有一类问题实际上很难用参数估计的方法去解决。 Example 7.2 某研究所推出一种感冒特效新药,为证明其疗效,选择 200 名患者为志愿 者。将他们均分为两组,分别不服药或服药,观察三日后痊愈的情况,得出下列数据。 是否痊愈 服何种药 痊愈者 未痊愈者 合计 未服药者 48 52 100 服药者 56 44 100 合 计 104 96 200 问新药是否确有明显疗效? 这个问题就不存在估计什么的问题。从数据来看,新药似乎有一定疗效,但效果不明显, 服药者在这次试验中的情况比未服药者好,完全可能是随机因素造成的。对于新药上市这样 关系到千万人健康的事,一定要采取慎重的态度。这就需要用一种统计方法来检验药效,假 设检验就是在这种场合下的常用手段。具体来说,我们先不轻易地相信新药的作用,因此可 以提出假设“新药无效”,除非抽样结果显著地说明这假设不合理,否则,将不能认为新药 有明显的疗效。这种提出假设然后做出否定或不否定的判断通常称为显著性检验(Significance test)。 假设检验也可分为参数检验(Parametric test)和非参数检验(Nonparametric test)。当总体 分布形式已知,只对某些参数做出假设,进而做出的检验为参数检验;对其它假设做出的检
验为非参数检验。如例7.1中,总体是两点分布,只需对参数P做出假设检验,这是参数检 验问题,而例7.2则是非参数检验的问题。与估计问题稍不同的是,一般来说非参数检验同 参数检验一样,在实际中经常要用到,因此,我们准备花一定的篇幅分别加以介绍。 无论是参数检验还是非参数检验,其原理和步骤都有共同的地方,我们将通过下面的例 子来阐述假设检验的一般原理和步骤 Example7.3据报载,某商店为搞促销,对购买一定数额商品的顾客给予一次摸球中奖 的机会,规定从装有红、绿两色球各10个的暗箱中连续摸10次(摸后放回),若10次都 是摸得绿球,则中大奖。某人按规则去摸10次,皆为绿球,商店认定此人作弊,拒付大奖, 此人不服,最后引出官司。 我们在此并不关心此人是否真正作弊,也不关心官司的最后结果,但从统计的观点看, 商店的怀疑是有道理的。因为,如果此人摸球完全是随机的,则要正好在10次摸球中均摸到 绿球的概率为()0= 这是一个很小的数,一个统计的基本原理是在一次试验中所发 1024 生的事件不应该是小概率事件。现在既然这样小概率的事件发生了,就应当推测出此人摸球 不是随机的,换句话说有作弊之嫌 上述的这一推断,实际上就是假设检验的全部过程。它一般包含了这么几步:提出假设, 抽样,并对样本进行加工(构造统计量),定出一个合理性界限,得出假设是否合理的结论。 为了便于操作,我们将结合例7.3,把这一过程步骤表述得更加形式化一点。这里要说明一点 的是所谓“小概率事件”。究竞多大概率为小概率事件?在一个问题中,通常是指定一个正 数a,0<a<1,认为概率不超过a的事件是在一次试验中不会发生的事件,这个a称为显著 性水平( Level of significance)。对于实际问题应根据不同的需要和侧重,指定不同的显著性水 平。但为了制表方便,通常可选取a=0.01,0.05,0.10等。 下面我们用假设检验的语言来模拟商店的推断 1°提出假设: Ho:此人未作弊;H1:此人作弊 这里H称为原假设( Null hypothesis),H1称为备选假设( Alternative hypothesis)或对立 假设( Opposite hypothesis),备选假设也可以不写 2°构造统计量,并由样本算出其具体值 统计量取为10次模球中摸中绿球的个数N.由抽样结果算出N=10 3°求出在H0下,统计量N的分布,构造对H0不利的小概率事件: 易知,在H。下,即如果此人是完全随机地摸球的话,统计量N服从二项分布B(10, 2).其分布列为P:=C0(2 k=0,1,2,…,10.那么此人摸到的绿球数应该在平均数5 个附近,所以对H0不利的小概率事件是:“绿球数N大于某个较大的数,或小于某个较小的 数。”在此问题中,若此H不成立,即此人作弊的话,不可能故意少摸绿球,因此只需考虑 事件“N大于某个较大的数”,这个数常称为临界值,即某个分位数 4°给定显著性水平a,确定临界值 即取一数n(a)使得PN>n(a)}=a.如取a=0.01,由分布列算出: P10=l/1024≈0.001,p=10/1024≈0.01,p+p10≈0.011 对于这种离散型概率分布,不一定能取到n(a).取最接近的n,使当H成立时 PN>m}≤a,因此n=9.即该小概率事件是{N>9} 5°得出结论 已算得N=10,即{N>9发生了,而{N>9被视为对H。不利的小概率事件,它在一 次试验中是不应该发生的,现在{N>9居然发生了,只能认为H是不成立的,即H1:“此
85 验为非参数检验。如例 7.1 中,总体是两点分布,只需对参数 P 做出假设检验,这是参数检 验问题,而例 7.2 则是非参数检验的问题。与估计问题稍不同的是,一般来说非参数检验同 参数检验一样,在实际中经常要用到,因此,我们准备花一定的篇幅分别加以介绍。 无论是参数检验还是非参数检验,其原理和步骤都有共同的地方,我们将通过下面的例 子来阐述假设检验的一般原理和步骤。 Example 7.3 据报载,某商店为搞促销,对购买一定数额商品的顾客给予一次摸球中奖 的机会,规定从装有红、绿两色球各10个的暗箱中连续摸10次(摸后放回),若 10 次都 是摸得绿球,则中大奖。某人按规则去摸10次,皆为绿球,商店认定此人作弊,拒付大奖, 此人不服,最后引出官司。 我们在此并不关心此人是否真正作弊,也不关心官司的最后结果,但从统计的观点看, 商店的怀疑是有道理的。因为,如果此人摸球完全是随机的,则要正好在 10 次摸球中均摸到 绿球的概率为 1024 1 ) 2 1 ( 10 = ,这是一个很小的数,一个统计的基本原理是在一次试验中所发 生的事件不应该是小概率事件。现在既然这样小概率的事件发生了,就应当推测出此人摸球 不是随机的,换句话说有作弊之嫌。 上述的这一推断,实际上就是假设检验的全部过程。它一般包含了这么几步:提出假设, 抽样,并对样本进行加工(构造统计量),定出一个合理性界限,得出假设是否合理的结论。 为了便于操作,我们将结合例 7.3,把这一过程步骤表述得更加形式化一点。这里要说明一点 的是所谓“小概率事件”。究竟多大概率为小概率事件?在一个问题中,通常是指定一个正 数 ,0 1 ,认为概率不超过 的事件是在一次试验中不会发生的事件,这个 称为显著 性水平(Level of significance)。对于实际问题应根据不同的需要和侧重,指定不同的显著性水 平。但为了制表方便,通常可选取 =0.01,0.05,0.10 等。 下面我们用假设检验的语言来模拟商店的推断: 1 0 提出假设: H0 :此人未作弊; H1 :此人作弊。 这里 H0 称为原假设(Null hypothesis),H1 称为备选假设(Alternative hypothesis)或对立 假设(Opposite hypothesis),备选假设也可以不写。 2 0 构造统计量,并由样本算出其具体值: 统计量取为 10 次模球中摸中绿球的个数 N .由抽样结果算出 N = 10 . 3 0 求出在 H0 下,统计量 N 的分布,构造对 H0 不利的小概率事件: 易知,在 H0 下,即如果此人是完全随机地摸球的话,统计量 N 服从二项分布B(10, 1/2).其分布列为 10 10 ) 2 1 ( k pk = C ,k = 0,1,2, ,10 .那么此人摸到的绿球数应该在平均数 5 个附近,所以对 H0 不利的小概率事件是:“绿球数 N 大于某个较大的数,或小于某个较小的 数。”在此问题中,若此 H0 不成立,即此人作弊的话,不可能故意少摸绿球,因此只需考虑 事件“ N 大于某个较大的数”,这个数常称为临界值,即某个分位数。 4 0 给定显著性水平 ,确定临界值: 即取一数 n() 使得P{ N > n() }= .如取 =0.01,由分布列算出: 1/1024 0.001, p10 = 10/1024 0.01, p9 = p9 + p10 0.011. 对于这 种离 散型 概率 分布 ,不 一定 能取 到 n() .取最 接近 的 n ,使当 H0 成立 时, P{N n} ,因此 n = 9 .即该小概率事件是 {N 9}. 5 0 得出结论: 已算得 N = 10 ,即 {N 9} 发生了,而 {N 9} 被视为对 H0 不利的小概率事件,它在一 次试验中是不应该发生的,现在 {N 9} 居然发生了,只能认为 H0 是不成立的,即 H1 :“此
人作弊”成立。 这一推断过程,也是假设检验的一般步骤,在这些步骤中,关键的技术问题是确定一个适 当的用以检验假设的统计量,这个统计量至少应该满足在H成立的情况下,其抽样分布易于 计算(査到)。当然还应该尽量满足一些优良性条件,特别是在参数检验中。限于篇幅,我 们不准备在本书中仔细讨论这些优良性条件。在统计量选定以后,便可构造出由该统计量T描 述某个显著性水平下的一小概率事件{T∈B},我们称使得这一小概率事件发生的样本空间 的点的全体 V={(X1,X2…,Xn)∈X:7(X1,X2,…,XnB)∈Ba} 为H的否定域( Negation region)或拒绝域( Rejection region),通常也简记为={T∈Ban}.最 后的检验即是判断所给的样本是否落在V内,或者是T∈B是否成立。因此,从这个意义上 可以说设计一个检验,本质上就是找到一个恰当的否定域V,使得在H。下,它的概率 P(|H)=(或≤)a 今后我们总是把统计检验中提到的“小概率事件”视为与否定域V是等价的概念。另外, 称V的余集X-为H0的接受域 §7.2正态总体参数检验( Parameter Test of Normal collectivity 对于正态总体,其参数无非是两个:期望和方差σ2,如果加上两总体的参数比较,概 括起来,对参数的假设一般只有如下四种情形:(i)对,(ⅱ)对a2,(ⅲ)对山1-2 (ⅳv)对σ2/σ2.其中情形(i)、(ⅲ)又分为a2(或a2,a2)已知和未知的两种情况 下面我们将分别予以讨论。如前所提到的,对于设计一个检验,关键是构造一个统计量 T=T(6),它需满足的一个必要条件是在H0成立时,分布为已知(有表可查),同时它 对于需要检验的参数来说应该是“较好”的,这一点与参数的区间估计很相似。在正态总体 参数的区间估计中,我们正好也是讨论了上述四种情形的置信区间。在区间估计中,我们曾 提到过,构造参数的置信区间的关键一步是从b的点估计出发,构造一个分布已知的含未知 参数θ的随机变量T(日),针对四种情况,当时我们构造的T(0)分别是 C1.对 7(4) X-A ,(a已知),T(4) X-A ,(a未知) O/vn 对 T(G2) 对p1-2 r(A,n2)=(x=1)-(-2),(a,a2已知) T(1,2) 1n1+2(万(二)(G=0未知) n1+n2 S,+ns n2(n21-1)S C4 对当:7(G2,2) n1(n2-1)S2a2 对于正态参数检验,我们也将针对不同情况,采用形式与上述随机变量T(O)完全一样的统计 量T(60),来作为检验统计量。但这里需要说明的是,作为区间估计中的T(0)与检验中的
86 人作弊”成立。 这一推断过程,也是假设检验的一般步骤,在这些步骤中,关键的技术问题是确定一个适 当的用以检验假设的统计量,这个统计量至少应该满足在 H0 成立的情况下,其抽样分布易于 计算(查到)。当然还应该尽量满足一些优良性条件,特别是在参数检验中。限于篇幅,我 们不准备在本书中仔细讨论这些优良性条件。在统计量选定以后,便可构造出由该统计量 T 描 述某个显著性水平下的一小概率事件{ T B },我们称使得这一小概率事件发生的样本空间 的点的全体 {( , , , ) : ( , , , ; ) } V = X1 X2 Xn T X1 X2 Xn B 为 H0 的否定域(Negation region)或拒绝域(Rejection region),通常也简记为 V ={ T B }.最 后的检验即是判断所给的样本是否落在 V 内,或者是 T B 是否成立。因此,从这个意义上 可以说设计一个检验,本质上就是找到一个恰当的否定域 V ,使得在 H0 下,它的概率 P(V | H0 ) = (或 )a 今后我们总是把统计检验中提到的“小概率事件”视为与否定域 V 是等价的概念。另外, 称 V 的余集 −V 为 H0 的接受域。 §7.2 正态总体参数检验(Parameter Test of Normal Collectivity) 对于正态总体,其参数无非是两个:期望 和方差 2 ,如果加上两总体的参数比较,概 括起来,对参数的假设一般只有如下四种情形:(ⅰ)对 ,(ⅱ)对 2 ,(ⅲ)对 1 − 2 , (ⅳ)对 2 2 2 1 / .其中情形(i)、(ⅲ)又分为 2 (或 2 2 2 1 , )已知和未知的两种情况。 下面我们将分别予以讨论。如前所提到的,对于设计一个检验,关键是构造一个统计量 ( ) T = T 0 ,它需满足的一个必要条件是在 H0 成立时,分布为已知(有表可查),同时它 对于需要检验的参数来说应该是“较好”的,这一点与参数的区间估计很相似。在正态总体 参数的区间估计中,我们正好也是讨论了上述四种情形的置信区间。在区间估计中,我们曾 提到过,构造参数 的置信区间的关键一步是从 的点估计出发,构造一个分布已知的含未知 参数 的随机变量 T ( ),针对四种情况,当时我们构造的 T ( )分别是 C1. 对 : ( ) ,(已知) n X T − = , ,( ) 1 ( ) 未知 − − = S n X T C2. 对 2 : 2 2 2 ( ) nS T = C3. 对 1 − 2 : ( 未知) ( 已知) 1 2 2 2 2 2 1 1 1 2 1 2 1 2 1 2 1 2 1 2 2 2 2 1 2 1 1 2 1 2 ( 2) ( ) ( ) ( , ) , , ( ) ( ) ( , ) = + − − − + + − = + − − − = n S n S X Y n n n n n n T n n X Y T C4. 对 2 2 2 1 : 2 2 2 1 2 1 2 1 2 2 2 1 2 2 2 1 ( 1) ( 1) ( , ) n n S n n S T − − = 对于正态参数检验,我们也将针对不同情况,采用形式与上述随机变量 T ( ) 完全一样的统计 量 ( ) T 0 ,来作为检验统计量。但这里需要说明的是,作为区间估计中的 T ( ) 与检验中的
T(O)是有所不同的,第一,T(O)中含有待估的未知参数θ,因此,它不是统计量,只是 般的随机变量;而T(O)中的参数6为一已知数,因此它是统计量。第二,T(6)的分布是己 知的,这是因为其中的与总体中的参数O是相一致的:而T(6)的分布则需在假设总体参数 θ明确时分布才已知。除此之外,它们的分布形式是完全一样的 上述统计量T(60)在H成立时通常有4种分布: D1.N(O.1)情形CL.、C3.中,σ(或σ1,O2)已知 D2t分布情形,C1.、C3.中,σ(或σ1,O2)未知; D3.x2分布,情形C2 D4.F分布,情形C4 我们分别称以它们为检验统计量的检验为u检验、t检验、x2检验和F检验。下面将分 别讨论这几种检验所适应的具体问题和检验的方法 检验( u test) u检验适应在方差已知的情况下,对期望的检验(单总体或双总体) (一)单总体情形 考察下面的例子: Example7.4一台包装机装洗衣粉,额定标准重量为500g,根据以往经验,包装机的 实际装袋重量服从正态N(G2),其中σ=15g,为检验包装机工作是否正常,随机抽取9 袋,称得洗衣粉净重数据如下(单位:g) 497506518524488517510515516 若取显著性水平a=0.01,问这包装机工作是否正常? 所谓包装机工作正常,即是包装机包装洗衣粉的份量的期望值应为额定份量500g,多装 了厂家要亏损,少装了损害消费者利益。因此要检验包装机工作是否正常,用参数表示就是 =500是否成立。 首先,我们根据以往的经验认为,在没有特殊情况下,包装机工作应该是正常的,由此 提出原假设和备选假设 Ho:=5 H1:4≠500 然后对给定的显著性水平α=0.01,构造统计量和小概率事件,来进行检验。 一般地,可将例7.4表述如下:设X~N(u,a2),G已知,X1X2,…,xn,为X的 子样,求对问题 的显著水平为a(0<a<1的检验。 这个问题就归结为,总体服从N(2),a2已知,需检验μ,由前所述,用u检验法 我们仿照例7.3的步骤来解这个问题 Solution1°提出假设(已有,略)。 2构造统计量。此问题属情形C1.的u检验,故用统计量 X 并计算其具体值。在例7.4中 u=((497+506+518+524+488+517+510+515+516)-500)(15/√9)=202 30易知,在H成立的条件下;u服从正态分布N(0,D),因此根据正态分布的特点,在H 成立的条件下,的值应以较大的概率出现在0的附近,因此对H0不利的小概率事件是u的
87 ( ) T 0 是有所不同的,第一, T ( ) 中含有待估的未知参数 ,因此,它不是统计量,只是一 般的随机变量;而 ( ) T 0 中的参数 0 为一已知数,因此它是统计量。第二, T ( ) 的分布是已 知的,这是因为其中的 与总体中的参数 是相一致的;而 ( ) T 0 的分布则需在假设总体参数 明确时分布才已知。除此之外,它们的分布形式是完全一样的。 上述统计量 ( ) T 0 在 H0 成立时通常有4种分布: D1. N(0,1) 情形 C1.、C3.中, (或1 , 2)已知 ; D2. t 分布情形,C1.、C3.中, (或1 , 2)未知 ; D3. 2 分布,情形 C2.; D4. F 分布,情形 C4. 我们分别称以它们为检验统计量的检验为 u 检验、 t 检验、 2 检验和 F 检验。下面将分 别讨论这几种检验所适应的具体问题和检验的方法。 一、 u 检验( u test) u 检验适应在方差已知的情况下,对期望的检验(单总体或双总体)。 (一)单总体情形 考察下面的例子: Example 7.4 一台包装机装洗衣粉,额定标准重量为 500g,根据以往经验,包装机的 实际装袋重量服从正态 ( , ) 2 N 0 ,其中 0 =15g,为检验包装机工作是否正常,随机抽取 9 袋,称得洗衣粉净重数据如下(单位:g) 497 506 518 524 488 517 510 515 516 若取显著性水平 =0.01,问这包装机工作是否正常? 所谓包装机工作正常,即是包装机包装洗衣粉的份量的期望值应为额定份量 500g,多装 了厂家要亏损,少装了损害消费者利益。因此要检验包装机工作是否正常,用参数表示就是 =500 是否成立。 首先,我们根据以往的经验认为,在没有特殊情况下,包装机工作应该是正常的,由此 提出原假设和备选假设: H0 : =500; H1 : 500 然后对给定的显著性水平 =0.01,构造统计量和小概率事件,来进行检验。 一般地,可将例 7.4 表述如下:设 ~ ( , ) 2 X N 0 , 2 0 已知, , , ., , X1 X2 Xn 为 X 的 一子样,求对问题 H0 : = 0 ; H1 : 0 的显著水平为 (0 1) 的检验。 这个问题就归结为,总体服从 ( , ) 2 N 0 , 2 0 已知,需检验 ,由前所述,用 u 检验法。 我们仿照例 7.3 的步骤来解这个问题。 Solution 1 0 提出假设(已有,略)。 2 0 构造统计量。此问题属情形C1.的u检验,故用统计量 n X u 0 0 − = 并计算其具体值。在例 7.4 中 (497 506 518 524 488 517 510 515 516) 500)/(15/ 9) 2.02 9 1 u = ( + + + + + + + + − = 3 0 易知,在 H0 成立的条件下; u 服从正态分布 N(0,1) ,因此根据正态分布的特点,在 H0 成立的条件下, u 的值应以较大的概率出现在0的附近,因此对 H0 不利的小概率事件是 u 的