第八章假设检验 【授课对象】理工类本科二年级 【授课时数】6学时 【授课方法】课堂讲授与提问相结合 【基本要求】1、理解显著性检验的基本思想,掌握显著性检验基本步骤和可能产生的两类错 2、掌握单个及两个正态总体的均值和方差的假设检验; 3、知道总体分布假设的x2检验法。 【本章重点】单个及两个正态总体的均值和方差的假设检验 【本章难点】两个正态总体的均值和方差的假设检验;总体分布假设的x2检验法 【授课内容及学时分配】 §8.1假设检验的基本思 假设检验是统计推断的另一类问题。在总体的分布函数完全未知,或只知其形式但不知 其参数的形式的情况下,为了推断总体的某些性质,提出了关于总体的某些假设。 、显著性检验的基本思想 为了对总体的分布类型或分布中的未知参数作出推断,首先对它们提出一个假设H,称 为原假设,同时给出其对立假设H1。为判断H正确还是H1正确,需要对总体进行抽样,然 后在H为真的条件下,通过选取恰当的统计量来构造一个小概率事件,若在一次试验中,小 概率事件居然发生了,就完全有理由拒绝H的正确性,否则没有充分理由拒绝H的正确性 从而接受H,这就是假设检验的基本思想。 怎样检验一个统计假设呢!下面结合例子来说明假设检验的基本思想和做法: 引例设总体x服从正态分布N(μ1),其中仅包含一个未知参数,即数学期望μ,欲要 求检验统计假设H:μ=0? 【分析】:在这里,总体X的分布函数形式是已知的,为正态分布N(H,1),其中仅含 个未知参数μ,同时也提出了一个统计假设Hμ=0。所以它是一个参数的显著性检验问题。 怎样判断这一统计假设H(μ=0)的正确性呢?首先需要对总体进行一定次数的观察,获 得数据,也就是说抽取样本。设我们从该总体中抽取了一个容量为10的简单随机样本,其观 察值记为(x1,x2…,x0),样本来自总体,反映了总体的分布规律,因此样本中必然包含关于
1 第八章 假设检验 【授课对象】理工类本科二年级 【授课时数】6 学时 【授课方法】课堂讲授与提问相结合 【基本要求】1、理解显著性检验的基本思想,掌握显著性检验基本步骤和可能产生的两类错 误; 2、掌握单个及两个正态总体的均值和方差的假设检验; 3、知道总体分布假设的 2 检验法。 【本章重点】单个及两个正态总体的均值和方差的假设检验 【本章难点】两个正态总体的均值和方差的假设检验;总体分布假设的 2 检验法。 【授课内容及学时分配】 §8.1 假设检验的基本思想 假设检验是统计推断的另一类问题。在总体的分布函数完全未知,或只知其形式但不知 其参数的形式的情况下,为了推断总体的某些性质,提出了关于总体的某些假设。 一、显著性检验的基本思想 为了对总体的分布类型或分布中的未知参数作出推断,首先对它们提出一个假设 H0 ,称 为原假设,同时给出其对立假设 H1 。为判断 H0 正确还是 H1 正确,需要对总体进行抽样,然 后在 H0 为真的条件下,通过选取恰当的统计量来构造一个小概率事件,若在一次试验中,小 概率事件居然发生了,就完全有理由拒绝 H0 的正确性,否则没有充分理由拒绝 H0 的正确性, 从而接受 H0 ,这就是假设检验的基本思想。 怎样检验一个统计假设呢!下面结合例子来说明假设检验的基本思想和做法: 引例:设总体 X 服从正态分布 N( ,1) ,其中仅包含一个未知参数,即数学期望 ,欲要 求检验统计假设 0 H : 0 = ? 【分析】:在这里,总体 X 的分布函数形式是已知的,为正态分布 N( ,1) ,其中仅含一 个未知参数 ,同时也提出了一个统计假设 0 H : 0 = 。所以它是一个参数的显著性检验问题。 怎样判断这一统计假设 0 H ( 0) = 的正确性呢?首先需要对总体进行一定次数的观察,获 得数据,也就是说抽取样本。设我们从该总体中抽取了一个容量为 10 的简单随机样本,其观 察值记为 1 2 10 ( , , , ) x x x ,样本来自总体,反映了总体的分布规律,因此样本中必然包含关于
未知参数μ的信息。但是要从样本中直接推断统计假设是否成立是困难的,还必需对样本进 行加工,把样本中包含的关于未知参数μ的信息集中起来,也就是说要构造一个适用于检验 假设H的统计量。这里μ是总体的均值,上一章已经看到,样本均值X是μ的一个无偏估计, 且x比样本的每个分量x,更集中的分布在总体均值μ的周围,如果假设H0(μ=0)是真的,则 样本均值ξ的观察值应较集中在0点附近,否则就应有偏离0点的趋势。这表明样本均值ξ 较好的集中了样本中所包含的关于μ的信息。因此利用x构造判断统计假设H0(μ=0)的方法 是合适的。 若从样本观察值计算得到x=1.01,那对假设H。(μ=0)的正确性能作出怎样的判断呢? 当假设H=0)成立时,x服从于N0D分布,由抽样分布知~N0.),因而 Px>101}=P√01010}≈21-(305别)000,这表明:如果假设H成立,那么 事件{>101实际上不大可能出现,即若在1009中,大约仅有两次使我们所观察到的样 本均值大于101。现在可否根据事件{x>101的概率很小这一理由而证实H0不成立呢?当 然不能。因为在假设H成立的条件下,事件{>101的概率虽很小,但这个事件仍可能出 现。显然我们也不能作肯定H的结论。但现在必须从“拒绝”和“接受”中选择一个较为合 理的判断作为我们的决定。一般它可以这样处理:给定一个临界概率α,如果在假设H成立 的条件下,出现观察到的事件{>对的概率小于等于a,就作拒绝假设H0的决定。一般应 取α为一个较小的数,这是因为我们给出假设H是经过细致的调查和考察的,所以对假设H 需加以保护,也就是说拒绝它应当慎重。根据小概率事件在一次试验(观察)中不可能发生 的实际推断原理,如果出现了这事件我们就有理由怀疑H不真,因为它超出了在H成立条 件下能以随机波动来解释的范围,因而作出拒绝H0的判断 、假设检验的基本步骤 1.由实际问题提出原假设H。(与备选假设H1); 2.选取适当的统计量,并在H为真的条件下确定该统计量的分布; 3.根据问题的要求确定显著性水平α(一般题目中会给定),从而得到拒绝域 4.由样本观测值计算统计量的观测值,看是否属于拒绝域,从而对H。作出判断。 两类错误 尚需指出,虽然在假设H为真时,发生作出拒绝H这一错误判断的概率很小,它小于 等于α,但这一错误还是可以发生的。在统计学上,当H。本来是正确的,但检验后作出了拒 绝H的判断,这种错误称为第一类错误,也称拒真错误。所以显著水平α是用来控制犯第
2 未知参数 的信息。但是要从样本中直接推断统计假设是否成立是困难的,还必需对样本进 行加工,把样本中包含的关于未知参数 的信息集中起来,也就是说要构造一个适用于检验 假设 H0 的统计量。这里 是总体的均值,上一章已经看到,样本均值 X 是 的一个无偏估计, 且 X 比样本的每个分量 Xi 更集中的分布在总体均值 的周围,如果假设 0 H ( 0) = 是真的,则 样本均值 X 的观察值应较集中在 0 点附近,否则就应有偏离 0 点的趋势。这表明样本均值 X 较好的集中了样本中所包含的关于 的信息。因此利用 X 构造判断统计假设 0 H ( 0) = 的方法 是合适的。 若从样本观察值计算得到 x =1.01 ,那对假设 0 H ( 0) = 的正确性能作出怎样的判断呢? 当假设 0 H ( 0) = 成立时, X 服从于 N(0,1) 分布,由抽样分布知 1 X N ~ (0, ) n ,因而 P X P X { 1.01} { 10 1.01 10} 2[1 (3.05)] 0.002 = − ,这表明:如果假设 H0 成立,那么 事件 { 1.01} X 实际上不大可能出现,即若在 1000 次中,大约仅有两次使我们所观察到的样 本均值大于 1.01。现在可否根据事件 { 1.01} X 的概率很小这一理由而证实 H0 不成立呢?当 然不能。因为在假设 H0 成立的条件下,事件 { 1.01} X 的概率虽很小,但这个事件仍可能出 现。显然我们也不能作肯定 H0 的结论。但现在必须从“拒绝”和“接受”中选择一个较为合 理的判断作为我们的决定。一般它可以这样处理:给定一个临界概率 ,如果在假设 H0 成立 的条件下,出现观察到的事件 { } X x 的概率小于等于 ,就作拒绝假设 H0 的决定。一般应 取 为一个较小的数,这是因为我们给出假设 H0 是经过细致的调查和考察的,所以对假设 H0 需加以保护,也就是说拒绝它应当慎重。根据小概率事件在一次试验(观察)中不可能发生 的实际推断原理,如果出现了这事件我们就有理由怀疑 H0 不真,因为它超出了在 H0 成立条 件下能以随机波动来解释的范围,因而作出拒绝 H0 的判断。 二、假设检验的基本步骤 1.由实际问题提出原假设 H0 (与备选假设 H1 ); 2.选取适当的统计量,并在 H0 为真的条件下确定该统计量的分布; 3.根据问题的要求确定显著性水平 (一般题目中会给定),从而得到拒绝域; 4.由样本观测值计算统计量的观测值,看是否属于拒绝域,从而对 H0 作出判断。 三、两类错误 尚需指出,虽然在假设 H0 为真时,发生作出拒绝 H0 这一错误判断的概率很小,它小于 等于 ,但这一错误还是可以发生的。在统计学上,当 H0 本来是正确的,但检验后作出了拒 绝 H0 的判断,这种错误称为第一类错误,也称拒真错误。所以显著水平 是用来控制犯第一
类错误的;同样,当H本来是不正确的,但检验后作出了接受H的判断,这种错误称为第 二类错误,也称受伪错误。对于给定的一对H和H,总可找出许多临界域,人们自然希望找 到这种临界域W,使得犯两类错误的概率都很小。奈曼一皮尔逊( Ne yman- Pearson)提出了 个原则:“在控制犯第一类错误的概率不超过指定值α的条件下,尽量使犯第二类错误β 小”,按这种法则做出的检验称为“显著性检验”,α称为显著性水平或检验水平。 §8.2參数的假设检验 我们这里仅介绍总体X的分布为正态分布时的几种显著性检验的方法。正态分布 (,2)含有两个参数和σ2,因此,这里的假设都是对这两个参数的假设。 U-检验:(在G2已知下,对μ进行检验) 设总体服从正态分布,在方差已知的条件下,若对期望进行检验,可用U-检验。 1.单总体U-检验: 设总体X~N(Ao2),其中。2已知,未知,(X1,X2…,Xn)为从X中抽取的一简单随 机样本 (1)双侧检验 要检验假设:H0:H=10,H1:≠0(双侧检验) 在前面的学习中我们知道,检验问题的关键是基于样本寻找一个合适的统计量,在这里 样本均值x很好地集中了样本中所包含的关于μ的信息。当假设H成立时,X的观察值x较 集中地分布在μ0的周围,否则就有偏离μ的趋势。所以X可以用来检验假设H。(μ=μ)。为 了查表方便,将标准化,从而统计量U=x万。在H(=以)为真时,U~N0D, 而当H0不真时,U服从均值不为0的N(…,1)分布,这表明当H不真时,的观察值有偏大 的趋势。所以对给定显著水平α,为使犯第二类错误的概率最小,查正态分布分位数表求出 μ-a/2使得 P h>-2}=P{U>u-2}+P{U<-u1n2}=1-(1-a/2)+a/2=a,然后将 样本观测值代入算出U的观察值u,并比较和μmn2,若>H-m2,则拒绝假设H0(=), 这样我们便得到了检验的拒绝域W={>H=2},即W={u>山-2或n<-A-m2}。否则接
3 2 2 类错误的;同样,当 H0 本来是不正确的,但检验后作出了接受 H0 的判断,这种错误称为第 二类错误,也称受伪错误。对于给定的一对 H0 和 H1 , 总可找出许多临界域,人们自然希望找 到这种临界域 W , 使得犯两类错误的概率都很小。奈曼—皮尔逊 (Neyman—Pearson)提出了 一个原则:“在控制犯第一类错误的概率不超过指定值 的条件下,尽量使犯第二类错误 小”,按这种法则做出的检验称为“显著性检验”, 称为显著性水平或检验水平。 §8.2 参数的假设检验 我们这里仅介绍总体 X 的分布为正态分布时的几种显著性检验的方法。正态分布 ( , ) 2 N 含有两个参数 和 2 ,因此,这里的假设都是对这两个参数的假设。 一、 U -检验:(在 2 已知下,对 进行检验) 设总体服从正态分布,在方差已知的条件下,若对期望进行检验,可用 U -检验。 1.单总体 U -检验: 设总体 ~ ( , ) 2 X N 0 ,其中 2 0 已知, 未知, ( , , , ) X1 X2 Xn 为从 X 中抽取的一简单随 机样本。 (1)双侧检验 要检验假设: 0 0 1 0 H : = , H : (双侧检验) 在前面的学习中我们知道,检验问题的关键是基于样本寻找一个合适的统计量,在这里 样本均值 X 很好地集中了样本中所包含的关于 的信息。当假设 H0 成立时, X 的观察值 x 较 集中地分布在 0 的周围,否则就有偏离 0 的趋势。所以 X 可以用来检验假设 0 0 H ( ) = 。为 了查表方便,将 X 标准化,从而统计量 0 0 X U n − = 。在 0 0 H ( ) = 为真时, U N ~ (0,1), 而当 H0 不真时, U 服从均值不为 0 的 N( ,1) 分布,这表明当 H0 不真时, U 的观察值有偏大 的趋势。所以对给定显著水平 ,为使犯第二类错误的概率最小,查正态分布分位数表求出 1 / 2 − 使得 = + − = − − + = − { = 1− / 2 } { 1− / 2 } { 1− / 2 } 1 (1 / 2) / 2 0 0 n u P U u P U u X P U ,然后将 样本观测值代入算出 U 的观察值 u ,并比较 u 和 1 / 2 − ,若 1 / 2 u − ,则拒绝假设 0 0 H ( ) = , 这样我们便得到了检验的拒绝域 { } W = u 1− / 2 ,即 { } W = u 1− / 2或u −1− / 2 。否则接
受假设H。。 例1:糖厂用自动包装机进行包糖,要求每袋0.5公斤,假定该机器包装重量 X~N(、00152),现从生产线上随机取九袋乘重得X=0.509,问该包装机生产是否正常? 解:由题意有包装机装糖重量X~N(、00152),要检验假设 H0:4=05,H1:≠0.5,由于2=00152已知,可用U-检验,取显著水平a=05,查表 得山-a2=0=19,而阿 9(0.509-0.5) 18<1.96没有落入拒绝域W内,所以由该 0.015 样本,还没有得到足够的理由来拒绝原假设H,故接受原假设,即生产正常 上述这种假设,其备择假设H1:μ≠μ表明期望值μ可能大于A0,也可能小于4,我们 称这种检验为双侧检验。这种检验对给定的显著性水平α,按照“使犯第二类错误的概率最 小”的原则所确定的拒绝域W={>山-an2或u<-1a2},是小于一个给定较小的数而大于 个给定较大数的所有数值的集合,该拒绝域不能用一个区间来表示 (2)单侧检验: 有时,我们只关心总体的期望是否增大,如产品的质量、材料的强度、元件的使用寿命 等是否随着工艺改革而比以前提高,此时需检验假设H。:μ≤山,H1:4>,还有一些问题, 如新工艺是否降低了产品中的次品数,此时要检验假设 H0:4≥4,H1:μ<,像这种备择假设H1:μ>A0(或μ<A)表示期望值只可能大于山 (或只能小于μ0),这种检验称为单侧检验。对于单侧检验,最终得到的拒绝域的形式又如 何呢?下面以假设H0:4≤40,H1:4>0为例给予讨论 当G2=2为已知时,仍用U-检验。统计量U=出只有当H1:>A成立时有 变大的趋势,因此,对于给定的显著性水平α,该检验的拒绝域应取为 W={u>1-a} 同理,对于假设H0:4≥1,H1:4<在给定的显著性水平a,该检验的拒绝域应取为 {<-H1-a} 例2:设某电子产品平均寿命5000小时为达到标准,现从一大批产品中抽出12件试验 结果如下:5059,3897,3631,5050,7474,5077
4 受假设 H0。 例 1:糖厂用自动包装机进行包糖,要求每袋 0.5 公斤,假定该机器包装重量 ~ ( ,0.015 ) 2 X N ,现从生产线上随机取九袋乘重得 X = 0.509 ,问该包装机生产是否正常? 解:由题意有包装机装糖重量 ~ ( ,0.015 ) 2 X N ,要检验假设 H0 : = 0.5 , H1 : 0.5 ,由于 2 2 0 = 0.015 已知,可用 U -检验,取显著水平 = 0.05 ,查表 得 1− / 2 = 0.975 =1.96 ,而 1.8 1.96 0.015 9(0.509 0.5) = − U = 没有落入拒绝域 W 内,所以由该 样本,还没有得到足够的理由来拒绝原假设 H0 ,故接受原假设,即生产正常。 上述这种假设,其备择假设 1 0 H : 表明期望值 可能大于 0 ,也可能小于 0 ,我们 称这种检验为双侧检验。这种检验对给定的显著性水平 ,按照“使犯第二类错误的概率最 小”的原则所确定的拒绝域 { } W = u 1− / 2或u −1− / 2 ,是小于一个给定较小的数而大于一 个给定较大数的所有数值的集合,该拒绝域不能用一个区间来表示。 (2)单侧检验: 有时,我们只关心总体的期望是否增大,如产品的质量、材料的强度、元件的使用寿命 等是否随着工艺改革而比以前提高,此时需检验假设 0 0 1 0 H : , H : ,还有一些问题, 如新工艺是否降低了产品中的次品数,此时要检验假设 0 0 1 0 H : , H : ,像这种备择假设 : ( ) H1 0 或 0 表示期望值只可能大于 0 (或只能小于 0 ),这种检验称为单侧检验。对于单侧检验,最终得到的拒绝域的形式又如 何呢?下面以假设 0 0 1 0 H : , H : 为例给予讨论: 当 2 0 2 = 为已知时,仍用 U -检验。统计量 n X U 0 0 − = 只有当 1 0 H : 成立时有 变大的趋势,因此,对于给定的显著性水平 ,该检验的拒绝域应取为 { } W = u 1− 。 同理,对于假设 0 0 1 0 H : , H : 在给定的显著性水平 ,该检验的拒绝域应取为 { } W = u −1− 。 例 2:设某电子产品平均寿命 5000 小时为达到标准,现从一大批产品中抽出 12 件试验 结果如下:5059,3897,3631,5050,7474,5077
4545,6279,3532,2773,7419,5116 假设该产品的寿命X~N(,1400),试问此批产品是否合格? 解:由题意可知该产品寿命X~N(山1400),要检验假设 H0:4≥500,01:μ<500,计算知x=4986,n=12,on=√1400,则 √2(4986-50002-1296,取a=005,查得A1n=A0=1645,拒绝域 400 W={u<-μ1a},而此时-1.296>-1.645,故可接受H0,即认为该批产品合格。 2.两总体U-检验: 实际工作中常常需要对两个正态总体进行比较,这种情况实际上就是两个正态总体参数 的假设检验问题。 设X~N(A,a12),y~N(2,o2),其中σ12,2已知,且X与y相互独立。 (X1,X2…,Xn),(H1,Y2,…,P2)分别为来自总体X与y的两个样本 对,H2检验下面的统计假设 H0:A1=42,H1:山≠2(双侧检验)域或H0A≤2,H1:1>42(单侧检验)},由抽 样分布中的定理知:XM、162),Y~N(2a2),又F与F独立,从而有 x-~N(1-42+02-)。当原假设H0成立时,统计量 X-Y ~N(O1),否则U有增大的趋势,故对给定的显著性水平a,为使犯第 G;/n1+σ, 二类错误的概率最小,取拒绝域W={>4=2} 例3:书P213例1 T一检验(在σ2未知下,对μ进行检验) 设总体服从正态分布,由前面我们知道:在方差已知的条件下,若对期望进行检验,可 用U-检验,但如果方差未知,对期望进行检验,可用T一检验 1.单总体T一检验: 设总体X~N(,02),山a2未知,(X1,X2…Xn)为随机样本,要检验假设:
5 4545,6279,3532,2773,7419,5116 假设该产品的寿命 X ~ N(,1400) ,试问此批产品是否合格? 解:由题意可知该产品寿命 X ~ N(,1400) ,要检验假设 H0 : 5000 , H1 : 5000 ,计算知 x = 4986 , n =12 , 0 = 1400 ,则 1 296 1400 12 4986 5000 0 0 . ( ) n X U = − − = − = ,取 = 0.05 ,查得 1− = 0.95 =1.645 ,拒绝域 W {u } = −1− ,而此时-1.296>-1.645,故可接受 H0 ,即认为该批产品合格。 2.两总体 U -检验: 实际工作中常常需要对两个正态总体进行比较,这种情况实际上就是两个正态总体参数 的假设检验问题。 设 ~ ( , ) , ~ ( , ) 2 2 2 2 X N 1 1 Y N ,其中 2 2 2 1 , 已知,且 X 与 Y 相互独立。 ( , , , ) , ( , , , ) 1 2 n1 1 2 n2 X X X Y Y Y 分别为来自总体 X 与 Y 的两个样本。 对 1 2 , 检验下面的统计假设: 0 1 2 1 1 2 H : = , H : (双侧检验){或 0 1 2 1 1 2 H : , H : (单侧检验)},由抽 样 分 布 中 的定 理 知 : ) 1 ) , ~ ( , 1 ~ ( , 2 2 2 2 2 1 1 1 n Y N n X N , 又 X 与 Y 独 立 , 从而 有 ~ ( , ) 2 2 2 1 2 1 1 2 n n X Y N − − + 。当原假设 H0 成立时,统计量 ~ (0,1) 2 2 1 2 2 1 N n n X Y U + − = ,否则 U 有增大的趋势,故对给定的显著性水平 ,为使犯第 二类错误的概率最小,取拒绝域 { } W = u 1− / 2 。 例 3:书 P213 例 1 二、 T —检验(在 2 未知下,对 进行检验) 设总体服从正态分布,由前面我们知道:在方差已知的条件下,若对期望进行检验,可 用 U -检验,但如果方差未知,对期望进行检验,可用 T —检验。 1.单总体 T —检验: 设总体 ~ ( , ) 2 X N , 2 , 未知, ( , , ) X1 X2 Xn 为随机样本,要检验假设: