与犯第一类错误概率相联系的另一个概念是检验水平,其定义如下: 定义5.1.3设p是(1.1)的一个检验,而0≤a≤1.如果p犯第一类错误的概率总不超过a (或等价地说,若p满足:B(0)≤a,对一切0∈日o),则称a是检验p的一个水平,而p称为显著性 水平为a的检验,简称水平为α的检验. 按这一定义,检验的水平不唯一.若a为检验p的水平,而a<a'<1,则a'也是检验p的水平 为避免这一问题,有时称一个检验的最小水平为其真实水平.也就是 检验p的真实水平=sup{Be(0),9∈Θo} (1.6) 至于水平的选择,习惯上把α取得比较小且标准化,如a=0.01,0.05,0.10等.标准化是为了方 便造表 水平的选取,对检验的性质有很大影响.不难了解,如果水平选得很低,那么我们容许犯第一 类错误的概率很小,而为了达到这一点势必大大缩小否定域,而这样就增加了犯第二类错误的可 能性.反之,若水平选得高,则否定域扩大,使接受域缩小,从而犯第二类错误的概率相应的将降 低.这样看来,水平的选择不是一个数学问题,而是一个必须从实际角度来考虑的问题.一般说来 有以下几个因素影响水平的选定 1.当一个检验涉及两方利益时,水平的选定常是双方协议的结果.以例5.1.1为例,商店向工 厂进货,检验其次品率是否超过0.01,若水平选的低,则可能有较多的次品被商店接受:反之,若水 平定的高,则将有较多的合格品被商店拒收.因此水平定的大小涉及商店和工厂双方利益,应由 双方商定.如前所述有时还要采取随机化的方法,使双方利益达到平衡】 2.两种错误的后果一般在性质上有很大的不同.如果第一类错误的后果在性质上很严重,我 们就力求在合理的范围内尽量减少犯这种错误的可能性,这时相应的水平就取得更低一些.例 如,制药厂要生产一种新药代替旧药治疗某种疾病,安排了一些试验,要对新旧药物疗效作出检 验.由于旧药已经长期临床使用,有一定的疗效.新药尚未经长期临床使用,一旦效果不好时,将 危及病人的生命安全,造成的后果会很严重.所以在进行检验时,将原假设Ho设为”旧药不比 新药差”,且使检验水平α定得更小一些,这样使Ho被否定的可能性大大减小了.这样就保证了: “原假设被否定、新药被接受的检验”将是非常严格的。 3.一般说来,试验者在试验前对问题的情况总不是一无所知的.他对问题的了解使他对零假 设是否能成立就有了一定的看法.这种看法可能影响到他对水平的选择.比方说一个物理学家 根据某种理论推定随机变量X应有分布F,而他打算将这一理论付诸检验.很明显,如果他对这一 理论很有信心,他将非常倾向于认为假设能成立,这时只有很有力的证据才可能使他认为这假设 不对.相应地,他将把检验水平取得低一些 在实际问题中,零假设被否定,常常意味着推翻一种理论或用新方法来代替一直使用的 标准方法.在大多数情况下,人们希望这样做时有相当大的根据.从这里可以看到,Neyman- Pearson:控制犯第一类错误的原则,在零假设的选择中有很大的实际意义,而决不单纯是一数学 问题.同时,也进一步理解了在假设检验问题中,零假设处在突出地位的原因 最后要说明的一点是:若水平α很小,原假设H0不会轻易被否定.如果样本观察值落入了否定 域,我们做出“否定原假设Ho”的结论就比较可靠(因为,此时我们只会犯第一类错误,且其概 率很小).反之,当α很小时,如果样本观察值落入接受域,我们做出“接受原假设Ho”的结论未必 可靠.这只能表明:在所选定的水平下没有充分根据认为H不成立,决不意味着有充分根据说明 它正确(因为此时我们只会犯第二类错误,但其概率可能很大)· 6
Üã1òaÜÿV«ÉÈX,òáVg¥uY², Ÿ½¬Xe: ½¬5.1.3 ϕ¥(1.1)òáu, 0 ≤ α ≤ 1. XJϕã1òaÜÿV«oÿáLα (½d/`, eϕ˜v: βϕ(θ) ≤ α,ÈòÉθ ∈ Θ0) , K°α¥uϕòáY², ϕ°èwÕ5 Y²èαu, {°Y²èαu. U˘ò½¬,uY²ÿçò.eαèuϕY², α < α0 < 1,Kα 0è¥uϕY². è;ù˘òØK, kû°òáuÅY²èŸ˝¢Y². è“¥ uϕ˝¢Y² = sup{ βϕ(θ), θ ∈ Θ0} (1.6) ñuY²¿J,S.˛rα'ÖIOz,Xα = 0.01, 0.05, 0.10. IOz¥è ê BEL. Y²¿, Èu5ükÈåKè. ÿJ ),XJY²¿È$, @o·ÇNNã1ò aÜÿV«È, è à˘ò:³7å冃½ç, ˘“O\ ã1aÜÿå U5. áÉ,eY²¿p,Kƒ½ç*å, ¶…ç†, l ã1aÜÿV«ÉAÚ¸ $. ˘w5,Y²¿Jÿ¥òáÍÆØK, ¥òá7Ll¢S›5ƒØK. òÑ`5 k±eAáœÉKèY²¿½. 1. òáu9¸ê|Ãû, Y²¿½~¥VêÆ(J. ±~5.1.1è~,˚AïÛ Ç?¿, uŸg¨«¥ƒáL0.01,eY²¿$,KåUkıg¨˚A…;áÉ,eY ²½p, KÚkı‹Ç¨˚A·¬. œdY²½å9˚A⁄ÛÇVê|Ã,Ad Vê˚½. Xc§„,kûÑáÊëÅzê{,¶Vê|Ãà²Ô. 2. ¸´ÜÿJòÑ35ü˛kÈåÿ”. XJ1òaÜÿJ35ü˛ÈÓ, · Ǔ¶3‹nâåS¶˛~ã˘´ÜÿåU5,˘ûÉAY²“ç$ò . ~ X,õÜÇá)ò´#ÜìOŒÜ£,´;æ, S¸ ò £,áÈ#ŒÜ‘ä—u . duŒÜƲœK¶^,kò½. #ܡô²œK¶^, òJÿ–û,Ú à9æ<)·S, E§J¨ÈÓ. §±3?1uû, ÚbH0蔌Üÿ' #Ü”,Ö¶uY²α½çò , ˘¶H0ƒ½åU5åå~ . ˘“y : /bƒ½!#Ü…u0Ú¥ö~ÓÇ. 3. òÑ`5,£ˆ3£cÈØKú¹oÿ¥òç. ¶ÈØK )¶¶È"b ¥ƒU§·“k ò½w{, ˘´w{åUKè¶ÈY²¿J. 'ê`òá‘nÆ[ ä‚,´nÿ̽ëÅC˛XAk©ŸF, ¶ãéÚ˘ònÿGÃu. Ȳw,XJ¶È˘ò nÿÈk&%,¶Úö~ñïu@èbU§·, ˘ûêkÈkÂy‚‚åU¶¶@è˘b ÿÈ. ÉA/,¶ÚruY²$ò . 3¢SØK•, "bƒ½, ~~øõXÌÄò´nÿ½^#ê{5ìOòܶ^ IOê{. 3åıÍú¹e,<ÇF"˘âûkÉåä‚. l˘på±w, NeymanPearsonõõã1òaÜÿK,3"b¿J•kÈå¢Sø¬, ˚ÿ¸X¥òÍÆ ØK. ”û,è?ò⁄n) 3buØK•,"b?3‚—/†œ. Åá`²ò:¥:eY²αÈ,bH0ÿ¨î¥ƒ½. XJ* ä·\ ƒ½ ç, ·Çâ—/ƒ½bH00(ÿ“'åÇ(œè, dû·Çê¨ã1òaÜÿ, ÖŸV «È). áÉ, αÈû,XJ* ä·\…ç,·Çâ—/…bH00(ÿô7 åÇ. ˘êUL²:3§¿½Y²evkø©ä‚@èH0ÿ§·,˚ÿøõXkø©ä‚`² ß((œèdû·Çê¨ã1aÜÿ, ŸV«åUÈå) . 6
五、求解假设检验问题的一般步骤 1.根据问题的要求提出零假设Ho和备择假设H1; 2.导出否定域的形式,确定检验统计T(X),其中临界值A待定 3.选取适当水平,利用检验统计量的分布求出临界值A 4.由样本X算出检验统计量T(X)的具体值,代入到否定域中,与临界值相比较,作出接受或 者拒绝原假设Ho的结论。 2正态总体参数的假设检验 正态分布是最常见的分布,关于它的参数的假设检验是实际中常遇到的问题,因此也是最重 要的一类检验问题.本节将分下列几种情况来讨论正态总体参数的直观检验方法:单个正态总 体均值和方差的检验;两个正态总体均值差和方差比的检验;极限分布为正态分布的有关大样本 检验 在讨论正态分布总体参数的假设检验问题时,S2.4中的定理2.2.3和推论2.4.2-推论2.4.5在求 检验统计量的分布中起到十分重要的作用. 一、单个正态总体均值的检验 设X=(X1,.·,X)为从正态总体N(山,σ2)中抽取的简单随机样本,给定检验水平α,求下 列三类检验问题: (1)H0:4=0←→H1:μ≠40 (2)H6:μ≤0←→H:μ>0 (3)H6:μ≥0←→H:μ<0 其中o和检验水平α给定. 我们称检验问题(1)为双边检验(two-side test),称检验问题(2)和(3)为单边检验(one-side test). 单个正态总体方差未知时的检验问题要比方差已知情况更常见,我们将重点讨论这一情形 关于均值已知时的检验方法,我们将在后面给一个说明. 首先考虑检验问题(1),即 H0:4=0←→H1:μ≠40 我们用直观方法构造检验的否定域.我们知道了=员∑”1X:是的无偏估计,且具 有良好性质.直观上看引区-0越大,Ho越不象成立.因此检验的否定域可取如下形式: {X=(X1,.,Xn):1区-o>A,A待定.当σ2未知时,由推论2.4.2可知,在μ=o条件下, T=(r-0) tn-1 (2.1) 因此取T=四作为检验统计量,则否定域的等价形式可取为 {(Xi,,Xn):T>c},c待定. 7
!¶)buØKòÑ⁄½ 1. 䂨Ká¶J—"bH0⁄JbH1; 2. —ƒ½ç/™, (½u⁄OT(X), Ÿ•.äAñ½. 3. ¿·Y², |^u⁄O˛©Ÿ¶—.äA. 4. dXé—u⁄O˛T(X)‰Nä, ì\ƒ½ç•, Ü.äÉ', ä—…½ ˆ·˝bH0(ÿ. 2 oNÎÍbu ©Ÿ¥Å~Ñ©Ÿ, 'ußÎÍbu¥¢S•~ëØK, œdè¥Å áòauØK. !Ú©eA´ú¹5?ÿoNÎÍÜ*uê{: ¸áo N˛ä⁄êu; ¸áoN˛ä⁄ê'u; 4Å©Ÿè©Ÿk'å u. 3?ÿ©ŸoNÎÍbuØKû, §2.4•½n2.2.3⁄Ìÿ2.4.2–Ìÿ2.4.53¶ u⁄O˛©Ÿ•Âõ©áä^. ò!¸áoN˛äu X = (X1, . . . , Xn)èloNN(µ, σ2 )•ƒ{¸ëÅ, â½uY²α, ¶e nauØK: (1) H0 : µ = µ0 ←→ H1 : µ 6= µ0; (2) H0 0 : µ ≤ µ0 ←→ H0 1 : µ > µ0; (3) H00 0 : µ ≥ µ0 ←→ H00 1 : µ < µ0; Ÿ•µ0⁄uY²αâ½. ·Ç°uØK(1)èV>u (two-side test), °uØK(2)⁄(3)è¸>u (one-side test). ¸áoNêôûuØKá'êÆú¹ç~Ñ, ·ÇÚ:?ÿ˘òú/. 'u˛äÆûuê{, ·ÇÚ3°âòá`². ƒkƒuØK(1), = H0 : µ = µ0 ←→ H1 : µ 6= µ0 ·Ç^Ü*ê{Euƒ½ç. ·ÇX¯ = 1 n Pn i=1 Xi ¥µÃ†O, Ö‰ k˚–5ü. Ü*˛w|X¯ − µ0|å, H0ÿñ§·. œduƒ½çåXe/™: {X = (X1, . . . , Xn) : |X¯ − µ0| > A}, Añ½. σ 2ôû, dÌÿ2.4.2å,3µ = µ0^áe, T = √ n(X¯ − µ0) S ∼ tn−1. (2.1) œdT = √ n(X¯−µ0) S äèu⁄O˛,Kƒ½çd/™åè (X1, . . . , Xn) : |T| > c , c ñ½. 7