目录第七章假设检验187.2重要参数检验1一样本正态总体均值和方差的检验1$7.2.1两样本正态总体的情形6$7.2.2成对数据7$7.2.30-1分布中未知参数p的假设检验8$7.2.4置信区间和假设检验之间的关系9$7.2.5i
8 ¹ 1ÔÙ bu 1 §7.2 ëêu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 §7.2.1 oNþÚu . . . . . . . . . . . . . . . . . . . 1 §7.2.2 üoN/ . . . . . . . . . . . . . . . . . . . . . . . . . . 6 §7.2.3 ¤éêâ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 §7.2.4 0-1 ©Ù¥ëêp bu . . . . . . . . . . . . . . . . . . . . 8 §7.2.5 &«mÚbum'X . . . . . . . . . . . . . . . . . . . . 9 i
第七章假设检验87.2重要参数检验本节介绍最基本的假设检验问题:一样本和两样本正态总体的有关均值和方差的检验,简单的大样本检验(0-1分布参数的假设检验),87.2.1一样本正态总体均值和方差的检验现实中经常碰到诸如此类的问题:假设用于某用途的合格铁钉要求长度为10厘米现有经销商从生产厂家订购了一批这样的铁钉,为了检验该批检验产品是否合格,可以从中抽取一小部分进行测量检验,通常铁钉的长度服从一个正态分布,这类问题属于一样本正态总体的假设检验问题一般地,设总体X~N(μu,a2),-<μ<,g?>0;Xi,*,Xn是取自总体X的一个样本.取显著性水平为.(1)方差已知时均值的检验先考虑双侧假设,即要检验Ho:=oH:o由于μ的极大似然估计为文,取“标准化”后的检验统计量X-MOU = u(Xi,**,Xn)= VnO注意到当Ho成立时,U~N(0,1),UI应该较小,反之当|UI的观测值u(r1,,an)较大时,不利于零假设H。应该拒绝之.所以选拒绝域形如[IU > T].要求显著性水平为Q,即PHo(IUI> T) = α解得T=uα/2.于是检验的拒绝域为[[U]>Ua/2]1
1ÔÙ bu §7.2 ëêu !0Äbu¯K: ÚüoNk'þÚu , {üu(0-1 ©Ùëêbu). §7.2.1 oNþÚu y¢¥²~-ÃXda¯K: b^u,^åÜc¹¦Ý10 f, yk²ûl)[¾ 1ùc¹, uT1u¬´ÄÜ, ± l¥ÄÜ©?1ÿþu, Ï~c¹ÝÑl©Ù, ùa¯Káu oNbu¯K. /, oNX ∼ N(µ, σ2 ), −∞ < µ < ∞, σ2 > 0; X1, · · · , Xn ´goNX . wÍ5Y²α. (1) ®þu kÄVýb, =u H0 : µ = µ0 ↔ H1 : µ 6= µ0. duµ 4q,OX¯, “IOz”uÚOþ U = u(X1, · · · , Xn) = √ n X¯ − µ0 σ 5¿H0 ¤á, U ∼ N(0, 1), |U| AT, |U| *ÿu(x1, · · · , xn) , Ø|u"bH0 ATáý. ¤±Àáý/X {|U| > τ}. ¦wÍ5Y²α, = PH0 (|U| > τ ) = α, )τ = uα/2 . u´uáý {|U| > uα/2}. 1
即当观测值(a1,,n)满足不等式Vr-0l ta/26时拒绝Ho类似地,检验单侧假设Ho:μ=μoHi:μ>μo或者Ho:μμoHi:μ>μ仍然用统计量U,由于U大时不利于Ho,取拒绝域为[U > ua].而检验另一个单侧假设Ho:=oH:o或者Ho:≤μoH:μo的拒绝域为[U<-ua]虽然我们取的临界值只考虑使检验在μ=μo处的犯I类错误的概率为α,从检验的拒绝域的形状上可直接看出来在零假设下μ≤μo(或μ≥o)时犯第I类错误的概率恒小于或等于α.以上三个检验统称为u检验例7.2.1.随机地从一批铁钉中抽取16枚,测得它们的长度(单位:厘米)如下2.9423712.9886623.1062343.1093163.1184273.1322543.1400423.1701882.9025623.1280033.1464412.9782403.1036003.0033943.0443842.849916已知铁钉长度服从标准差为0.1的正态分布,在显著性水平α=0.01下,能否认为这批铁钉的平均长度为3厘米?如显著性水平为α=0.05呢?解:这是方差已知时关于均值μ的假设检验问题,Ho:μ=3H:μ3.取检验统计量为U=Vn(X-3)/0.1,检验的拒绝域为UI>uα/2-由样本算得检验统计量的值为u~2.16,如显著性水平为0.01,则临界值为u0.005~2.58,跟检验统计量的值比2
=*ÿ(x1, · · · , xn) ÷vت √ n |x¯ − µ0| σ > uα/2 áýH0. aq/, uüýb H0 : µ = µ0 ↔ H1 : µ > µ0 ½ö H0 : µ ≤ µ0 ↔ H1 : µ > µ0 E,^ÚOþU, duU Ø|uH0, áý {U > uα} . u,üýb H0 : µ = µ0 ↔ H1 : µ < µ0 ½ö H0 : µ ≤ µ0 ↔ H1 : µ < µ0 áý {U < −uα} . ,·.Ħu3µ = µ0 ?I aØVÇα, luáý /GþwÑ53"beµ ≤ µ0 (½µ ≥ µ0) 1I aØVÇðu½ uα. ±þnuÚ¡u u. ~ 7.2.1. Å/l1c¹¥Ä16 q, ÿ§Ý(ü : f) Xe: 2.942371 2.988662 3.106234 3.109316 3.118427 3.132254 3.140042 3.170188 2.902562 3.128003 3.146441 2.978240 3.103600 3.003394 3.044384 2.849916 ®c¹ÝÑlIO0.1 ©Ù, 3wÍ5Y²α = 0.01 e, UÄ@ù1c ¹²þÝ3 f? XwÍ5Y²α = 0.05 Q? ): ù´®'uþµ bu¯K, H0 : µ = 3 ↔ H1 : µ 6= 3. uÚOþU = √ n(X¯ − 3)/0.1, uáý|U| > uα/2 . duÚO þu ≈ 2.16, XwÍ5Y²0.01, K.u0.005 ≈ 2.58, uÚOþ' 2
较发现不能拒绝零假设,即不能推翻铁钉平均长度为3厘米的假设:而如果显著性水平为0.05时,临界值为u0.025=1.96,此时可以拒绝零假设,认为铁钉平均长度不等于3厘米这个例子说明结论可能跟显著性水平的选择有关:显著性水平越小,零假设被保护得越好从而更不容易被拒绝例7.2.2.对正态总体N(μ,a2)(其中2已知)下的假设检验问题Ho:μ=μo→H1:μ≠μo,如果我们还要求“犯第二类错误的概率要小于指定的β>0”该怎么办?解:根据功效函数和两类错误的定义,知道等价的要求(7.2.1)βo(μ)≥1-β, μ<μO但是,当μ<μo但μ接近μo时,β(μ)~α,而因为α,β一般都很小,因此一般有α<1-β,这就看出要求(7.2.1)无法达到。我们只能放松一些,要求对某个指定的μ1<μ0,有(7.2.2)βo(μ)≥1-β, μ<μ1因为β(μ)为μ的减函数,因此等价于要求βs(μ1)≥1-β此即(Vn(μo -μ) - u≥1-β0等价的得到n≥g(ua+ug)/(μo-μ)2也即要满足题目中的要求,样本大小至少要达到上式右边那么大。口(2)方差未知时均值的检验考虑检验Ho=o由于方差未知,可以在将X标准化的过程中用样本方差S2代替总体方差。2得检验统计量X-μoT=VnS由于在Ho下,T~tn-1,于是拒绝域取成[(T| > tn-1(α/2)] .3
uyØUáý"b, =ØUíc¹²þÝ3 fb; XJwÍ5Y² 0.05, .u0.025 = 1.96, d±áý"b, @c¹²þÝØu3 f. ù~f`²(ØUwÍ5Y²ÀJk': wÍ5Y², "bo Ðl ØN´áý. ~ 7.2.2. éoNN(µ, σ2 )(Ù¥σ 2®)ebu¯KH0 : µ = µ0 ↔ H1 : µ 6= µ0§ XJ·¦/1aØVÇu½β > 00TNoº )µâõ¼êÚüaؽ§d¦ βφ(µ) ≥ 1 − β, µ < µ0 (7.2.1) ´§µ < µ0µCµ0§βφ(µ) ≈ α§ Ïα, βÑé§Ïdkα < 1 − β§ ùÒwѦ(7.2.1)Ã{"·Ut §¦é,½µ1 < µ0§k βφ(µ) ≥ 1 − β, µ < µ1 (7.2.2) Ïβφ(µ)µ~¼ê§Ïddu¦ βφ(µ1) ≥ 1 − β d= Φ √ n(µ0 − µ) σ − uα ≥ 1 − β d n ≥ σ 2 (uα + uβ) 2 /(µ0 − µ) 2 =÷vK8¥¦§þªm>@o" (2) þu Äu H0 : µ = µ0 ↔ µ 6= µ0, du, ±3òX¯ IOzL§¥^S 2 OoNσ 2 , uÚO þ T = √ n X¯ − µ0 S . du3H0 e, T ∼ tn−1, u´áý¤ {|T| > tn−1(α/2)} . 3
此检验称为t检验类似地可以得到另外两个单侧假设的检验拒绝域,列于表7.2.1中例7.2.3.(例7.2.1续)设方差未知,则在水平0.01和0.05下能否认为铁钉平均长度为3厘米?解:这是方差未知时关于均值的假设检验问题,Ho:μ=3-Hi:μ+3取检验统计量为T=Vn(X-3)/S,检验的拒绝域为|TI>tn-1(α/2).由样本算得检验统计量的值约为2.21,与显著性水平0.01对应临界值t15(0.005)~2.95比较,不能拒绝零假设,而与显著性水平0.05对应临界值t15(0.025)~2.13比较,可以拒绝零假设,即在显著性水平0.01下不能拒绝铁钉平均长度为3厘米的假定,但在显著性水平0.05下可以认为铁钉平均长度不等于3厘米,此结论与方差已知情形一致(3)方差的检验考虑假设检验问题Ho:g2=0-Hi:0?+%对均值已知的情形,由。2的极大似然估计62 =↓(X - μ)2ni=l可以构造检验统计量=1712-0-%在Ho下,x2~x,x2的平均值为n,而在H下,x2=%的均值为%nn,因此当x2的值过于偏离n时应该拒绝Ho,于是拒绝域取成[x2 < xn(1 - α/2) 或者 x2 > xn(α/2)) 对均值未知的情形,构造检验统计量x2= (n-1)s2%4
du¡t u. aq/±, üüýbuáý, uL7.2.1¥. ~ 7.2.3. (~7.2.1Y) , K3Y²0.01 Ú0.05 eUÄ@c¹²þÝ3 f ? ): ù´'uþµ bu¯K, H0 : µ = 3 ↔ H1 : µ 6= 3 uÚOþT = √ n(X¯ − 3)/S, uáý|T| > tn−1(α/2). duÚ Oþ2.21, wÍ5Y²0.01 éA.t15(0.005) ≈ 2.95 ', ØUáý"b , wÍ5Y²0.05 éA.t15(0.025) ≈ 2.13 ', ±áý"b, =3wÍ 5Y²0.01 eØUáýc¹²þÝ3 fb½, 3wÍ5Y²0.05 e±@ c¹²þÝØu3 f, d(Ø®/. (3) u Äbu¯K H0 : σ 2 = σ 2 0 ↔ H1 : σ 2 6= σ 2 0 . éþ®/, dσ 2 4q,O σˆ 2 = 1 n Xn i=1 (Xi − µ) 2 ±EuÚOþ χ 2 = 1 σ 2 0 Xn i=1 (Xi − µ) 2 = nσˆ 2 σ 2 0 . 3H0 e, χ 2 ∼ χ 2 n , χ 2 ²þn, 3H1 e, χ 2 = σ 2 σ 2 0 nσˆ 2 σ2 þσ 2 σ 2 0 n 6= n, Ïdχ 2 Lu ln ATáýH0, u´áý¤ χ 2 < χ2 n (1 − α/2) ½ö χ 2 > χ2 n (α/2) . éþ/, EuÚOþ χ 2 = (n − 1)S 2 σ 2 0 , 4